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Polypeptides implio ( ms dans ta biosynthese pes sprawl s, sequences 

NUCLEOTIDIOU ES_CODANT CES POT .YPF.PTTDE s pr t pr T RS APPLICATIONS 



5 La presente invention conceme 1'isolement et 1'identification de nouveaux genes de 

la voie de biosynthese des spiramycines et de nouveaux polypeptides impliques dans 
cette biosynthese. Elle est egalement relative a 1'utilisation de ces genes dans le but 
d'augmenter les taux de production et la purete de la spiramycine produite. 

L'invention a egalement trait a 1'utilisation de ces genes pour la construction de 
mutants pouvant conduire a la synthese de nouveaux antibiotiques ou a des formes 
derivees de spiramycines. L'invention concerne encore les molecules produites grace a 
l'expression de ces genes et enfin des compositions pharmacologiquement actives d'une 
molecule produite grace a l'expression de tels genes. 

Les Streptomyces sont des bacteries filamenteuses Gram positif du sol. Elles' 
jouent un role important dans la decomposition et la mineralisation des matieres 
organiques grace a la grande diversite des enzymes degradatives qu'elles secretent. Elles 
presentent des phenomenes de differenciations morphologiques uniques chez les ; 
procaryotes s'accompagnant d'une differenciation metabolique caracterisee par la 
production de metabolites secondaires presentant une extraordinaire diversite de 
structures chimiques et d'activites biologiques. Parmi ces metabolites, on retrouve les 
spiramycines produites a V etat naturel par la bacterie Streptomyces ambofaciens. 

La spiramycine est un antibiotique de la famille des macrolides utile aussi bien en 
medecine veterinaire qu'en medecine humaine. Les macrolides sont caracterises par la 
presence d'un cycle lactone sur lequel sont greffes un ou plusieurs sucres. Streptomyces 
ambofaciens produit a 1'etat naturel la spiramycine I, II et III (cf. Figure 1), cependant 
l'activite antibiotique de la spiramycine I est nettement superieure a celle des 
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spiramycines II et III (Liu et aL, 1999). La molecule de spiramycins I est constitute d'un 
macro-cycle lactonique, appelle platenolide et de trois sucres : la forosamine, le 
mycaminose et le mycarose (cf. Figure 1). L'activite antibiotique des spiramycines est 
due a une inhibition de la synthese proteique chez les procaryotes par un mecanisme 
5 impliquant la liaison de P antibiotique au ribosome bacterien. 

Certains composes membres de la famille des macrolides et possedant egalement 
un cycle lactone ont donne lieu a des utilisations hors du domaine des antibiotiques. 
Ainsi le produit FK506 a des effets immunosuppresseurs et offre des perspectives 
d'application therapeutique dans le domaine de la transplantation d'organe, de Parthrite 
10 rhumatoide et plus general ement dans des pathologies liees a des reactions 
autoimmunes. D'autres macrolides comme Pavermectine ont des activites insecticides et 
anti-helminthiques. 

De nombreuses voies de biosynthese, concernant des antibiotiques appaftenant a 
des classes variees ainsi que d'autres metabolites secondaires (pour une revue, Chater K. 
15 1990), ont a ce jour deja ete etudiees chez les Streptomycetes. Cependant, la 
connaissance des voies de biosynthese des spiramycines n ! est que tres partielle a ce jour. 

La biosynthese des spiramycines est un processus complexe comportant de 
nombreuses etapes et impliquant de nombreuses enzymes (Omura et aL, 1979a, Omiirk 
et aL, 1979b). Les spiramycines appartiennent a la large classe des polyketides qui 

20 regroupe des molecules complexes particulierement abondantes dans les 
microorganismes du sol. Ces molecules sont regroupees non pas par analogie de 
structure mais par une certaine similarite au niveau d'etapes de leur voie de biosynthese. 
En effet, les polyketides sont produits par une serie complexe de reactions mais 
possedent en commun d ? avoir dans leur voie de biosynthese une serie de reactionis 

25 catalysees par une ou des enzymes appelees « polyketides synthases » (PKS). Chez 
Strepiomyces ambofaciens, la biosynthese du macro-cycle lactonique des spiramycines 
(platenolide) est realisee par une serie de huit modules codes par cinq genes PKS 
differents (Kuhstoss S., 1996, brevet US 5,945,320). Les spiramycines sont obtenues a 
partir de ce cycle lactone. Cependant, les diverses etapes et enzymes impliquees dans la 
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synthese des sucres, ainsi que lexir liaison an cycle lactone et la modification de ce cycle 
pour l'obtention des spiramycines restent encore inconnues a ce jour. 

Le brevet US 5,514,544 decrit le clonage d'une sequence appelee srmR chez 
Streptomyces ambofaciens. II est fait 1'hypothese dans ce brevet que le gene srmR code 
une proteine regulatrice de la transcription des genes impliques dans la biosynthese des 
macrolides. 

En 1987, Richardson et collaborateurs (Richardson et al., 1987) ont montre que la 
resistance a la spiramycine de S. ambofaciens est conferee par au moins trois genes, ces 
derniers ont ete appeles srmA, srmB et srmC. Le brevet US 4,886,757 decrit plus 
particulierement la caracterisation d'un fragment d'ADN de S. ambofaciens contenant le 
gene srmC. Cependant la sequence de ce gene n'a pas ete divulguee. En 1990, 
Richardson et collaborateurs (Richardson et aL, 1990) ont pose 1'hypothese de 
P existence de trois genes de biosynthese de la spiramycine proche de srmB. Le brevet 
US 5,098,837 rapporte le clonage de cinq genes potentiellement impliques dans la 
biosynthese de la spiramycine. Ces genes ont ete baptises srmD, srmE, srmF, srmG et 
srmH. 

Une des difficultes majeures dans la production de composes tels que les 
spiramycines reside dans le fait que de tres grands volumes de fermentation sont 
necessaires a la production d'une quantite relativement faible de produit. II est done 
souhaitable de pouvoir augmenter 1'efficacite de production de telles molecules afin ; 
d 'en diminuer les couts de production. 

La voie de biosynthese des spiramycines est un processus complexe et il serait ; 
souhaitable d'identifier et de supprimer les reactions parasites qui pourraient exister au 
cours de ce processus. Le but d'une telle manipulation est d'obtenir un antibiotique plus 
pur et/ou une amelioration de la productivite. A ce sujet, Streptomyces ambofaciens ' 
produit a l'etat naturel la spiramycine I, II et III (cf. Figure 1), cependant l'activite " 
antibiotique de la spiramycine I est nettement superieure a celle des spiramycines II et 
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III (Liu a/., 1999). II serait done souhaitable de pouvoir disposer de souches ne 
produisant que de la spiramycine I. 

En raison de Pinteret commercial des antibiotiques macrolides, l'obtention de 
nouveaux derives, notamment d' analogues de spiramycines ayant des proprietes 
5 avantageuses est intensivement recherchee. II serait souhaitable de pouvoir generer en 
quantite suffisante les intermedi aires de biosynthese de la voie de biosynthese des 
spiramycines ou des derives des spiramycines notamment dans le but de fabriquer des 
antibiotiques hybrides derives des spiramycines. 

10 Description generate de I 'invention 

La presente invention resulte du clonage de genes dont le produit intervient dans Ja 
biosynthese des spiramycines. L' invention concerne tout d'abord de nouveaux genes ide 
la voie de biosynthese des spiramycines et de nouveaux polypeptides impliques dans 
cette biosynthese. ;• 

15 Les genes de la voie de biosynthese et les sequences codantes associees ont ete 

clones et la sequence d'ADN de chacun a ete determinee. Les sequences codantes 
clonees seront designees par la suite orfl*c, or/2*c, or/3*c, orf4*c f or/5% orf6*, orfi*c, 
or/8% or/9* or/10% or/1, or/2, or/3, or/4, or/5, or/6, or/7, or/8, or/9c, or/10, or/llc, 
or/12, or/1 3c, or/14, or/1 5c, or/16, or/17, or/18, or/19, or/20, or/21 c, or/22c, or/23c t 

20 or/24c t or/2 5c, or/26, or/27 t or/28c, or/29, or/30c, or/31 et or/3 2c. La fonction des 
proteines codees par ces sequences dans la voie de biosynthese des spiramycines est 
developpee dans la discussion ci-apres qui est illustree par les figures 4, 5 5 6 et 8. 

1) Un premier objet de l'invention concerne un polynucleotide codant uh 
polypeptide implique dans la biosynthese des spiramycines caracterise en ce que la 
25 sequence dudit polynucleotide est : 
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(a) Pune des sequences SEQ ID N° 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 
30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 
109, 111, 113, 115, 118, et 120, 

(b) l'une des sequences constitutes par les variants des sequences (a), 

(c) rune des sequences derivees des sequences (a) et (b) en raison de la 
degenerescence du code genetique. 

2) La presente invention a egalement pour objet un polynucleotide s'hybridant 
dans des conditions d'hybridation de forte stringence a au moins 1'un des 
polynucleotides selon le paragraphe 1) ci-dessus. 

3) L'invention concerne egalement un polynucleotide presentant au moins 70%, 
80%, 85%, 90%, 95% ou 98% d'identite en nucleotides avec un polynucleotide 
comprenant au moins 10, 12, 15, 18, 20 a 25, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 
250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 
1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 
1800, 1850 ou 1900 nucleotides consecutifs d'un polynucleotide selon le paragraphe 1) 
ci dessus. 

4) L'invention concerne egalement un polynucleotide selon le pragraphe 2) ou 3) ; 
ci-dessus caracterise en ce qu'il est isole a partir d'une bacterie du genre Streptomyces. ' 

5) L'invention concerne egalement un polynucleotide selon le pragraphe 2), 3) ou 
4) ci-dessus caracterise en ce qu'il code une proteine impliquee dans la biosynthese 
d'un macrolide. 

6) L'invention concerne egalement un polynucleotide selon le pragraphe 2), 3) ou 
4) ci-dessus caracterise en ce qu'il code une proteine ayant une activite similaire a la 
proteine codee par le polynucleotide avec lequel il s'hybride ou il presente l'identite. 

7) L'invention concerne egalement un polypeptide resultant de Texpression d'uri 
polynucleotide selon le pragraphe 1 ), 2), 3), 4), 5) ou 6) ci-dessus. 
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8) Un autre aspect de T invention concerne un polypeptide implique dans la 
biosynthese des spiramycines caracterisee en ce que la sequence dudit polypeptide est : 

(a) Pune des sequences SEQ ID N° 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 27, 
29, 31, 32, 33, 35, 37, 38, 39, 41, 42, 44, 46, 48, 50, 51, 52, 54, 55, 56, 57, 58, 59, 61, : 

5 63, 65, 67, 69, 71, 73, 75, 77/79, 81, 83, 85, 108, 110, 112, 114, 116, 117, 119 et 121, 

(b) Tune des sequences telles que definies en (a) excepte que tout au long de 
ladite sequence un ou plusieurs acides amines ont ete substitues, inseres ou deletes sans 
en affecter les proprietes fonctionnelles, 

(c) Tune des sequences constitutes par les variants des sequences (a) et (b). 

10 9) Un autre objet de Pinvention concerne un polypeptide presentant au moins: 

70%, 80%, 85%, 90%, 95% ou 98% d'identite en acides amines avec un polypeptide 
comprenant au moins 10, 15, 20, 30 a 40, 50, 60, 70, 80, 90,100, 120, 140, 160, 180, 
200, 220, 240, 260, 280, 300, 320, 340, 360, 380, 400, 420, 440, 460, 480, 500, 526, 
540, 560, 580, 600, 620 ou 640 acides amines consecutifs d'un polypeptide selon le 

15 paragraphe 8) ci-dessus. 

10) Un autre aspect de V invention concerne un polypeptide selon le paragraphe 9) 
ci-dessus caracterise en ce qu'il est isole a partir d'une bacterie du genre Streptomyces. 

1 1) Un autre aspect de Pinvention concerne un polypeptide selon le paragraphe 9) 
ou 10) ci-dessus caracterise en ce qu'il code une proteine impliquee dans la biosynthese 

20 d'un macrolide. 

12) Un autre aspect de Pinvention concerne un polypeptide selon le pragraphe 9), 
10) ou 11) ci-dessus caracterise en ce qu'il a une activite similaire a celle du 
polypeptide avec lequel il partage Pidentite. 

13) Un autre aspect de Pinvention concerne un ADN recombinant caracterise eh 
25 ce qu'il comprend au moins un polynucleotide selon Pun des paragraphes 1), 2), 3), 4), . 

5) ou 6) ci-dessus. 
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14) Un autre aspect de 1'invention concerne un ADN recombinant selon le 
pragraphe 13) ci-dessus caracterise en ce que le dit ADN recombinant est compris dans 
un vecteur. 

15) Un autre aspect de 1'invention concerne un ADN recombinant selon le 
paragraphs 14) ci-dessus caracterise en ce que ledit vecteur est choisi parmi les 
bacteriophages, les plasmides, les phagemides, les vecteurs integratifs, les fosmides, les 
cosmides, les vecteurs navettes, les BAC ou les PAC. 

16) Un autre aspect de 1'invention concerne un ADN recombinant selon le 
pragraphe 15) ci-dessus caracterise en ce qu'il est choisi parmi pOS49.1, pOS49.11, 
pOSC49.12, pOS49.14, pOS49.16, pOS49.28, pOS44.1, pOS44.2, pOS44.4, pSPM5^ 
pSPM7, pOS49.67, pOS49.88, pOS49.106, pOS49.120, pOS49.107, pOS49.32, 
pOS49.43, pOS49.44, pOS49.50, pOS49.99, pSPM17, pSPM21, pSPM502, pSPM504, 
pSPM507, pSPM508, pSPM509, pSPMl, pBXLllll, pBXL1112, pBXL1113, 
pSPM520, pSPM521, pSPM522, pSPM523, pSPM524, pSPM525, pSPM527, 
pSPM528, pSPM34, pSPM35, pSPM36, pSPM37, pSPM38, pSPM39, pSPM40, 
pSPM41, pSPM42, pSPM43, pSPM44, pSPM45, pSPM47, pSPM48, pSPM50, 
pSPM51, pSPM52, pSPM53, pSPM55, pSPM56, pSPM58, pSPM72, pSPM73," 
pSPM515, pSPM519, pSPM74 etpSPM75. 

17) Un autre aspect de 1'invention concerne un vecteur d'expression caracterise en 
ce qu'il comprend au moins une sequence d'acide nucleique codant un polypeptide 
selon le pragraphe 7), 8), 9), 10), 1 1) ou 12) ci-dessus. 

18) L'invention est egalement relative a un systeme d'expression comprenant uh 
vecteur d'expression approprie et une cellule hote permettant l'expression d'un ou 
plusieurs polypeptides selon le paragraphe 7), 8), 9), 10), 1 1) ou 12) ci-dessus. 

19) L'invention est egalement relative a un systeme d'expression selon le 
paragraphe 18 ci-dessus caracterise en ce qu'il est choisi parmi les systemes 
d'expression procaryotes ou les systemes d'expression eucaryotes. 
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20) L'invention est egalement relative a un systeme d' expression selon le 
paragraphe 19) ci-dessus caracterise en ce qu'il est choisi parmi les systemes 
d' expression chez la bacterie E. coli, les sytemes d' expression baculo virus permettant 
une expression dans des cellules d'insectes, les sytemes d'expression permettant urie 

5 expression dans des cellules de levures, les sytemes d'expression permettant une 
expression dans des cellules de mammiferes. 

21) L'invention est egalement relative a une cellule hote dans laquelle a ete 
introduit au moins un polynucleotide et/ou au moins un ADN recombinant et/ou au 
moins un vecteur d'expression selon Tun des pragraphes 1), 2), 3), 4), 5), 6), 13), 14), 

10 15), 16) ou 17) ci-dessus. 

22) L'invention est egalement relative a un procede de production d'un 
polypeptide selon le paragraphe 7), 8), 9), 10), 11) ou 12) ci-dessus caracterise en ce 
que ledit procede comprend les etapes suivantes: 

a) inserer au moins un acide nucleique codant ledit polypeptide dans un vecteur s 
15 approprie ; 

b) cultiver, dans un milieu de culture approprie, une cellule hote prealablement 
transformee ou transfectee avec le vecteur de l'etape a) ; 

c) recuperer le milieu de culture conditionne ou un extrait cellulaire; 

d) separer et purifier a partir dudit milieu de culture ou encore a partir de 
20 Textrait cellulaire obtenu a Petape c), ledit polypeptide ; 

e) le cas echeant, caracteriser le polypeptide recombinant produit 

23) Un autre aspect de l'invention concerne un microorganisme bloque dans une 
etape de la voie de biosynthese d'au moins un macrolide. 

24) Un autre aspect de I 5 invention concerne un microorganisme selon le 
25 paragraphe 23) ci-dessus caracterise en ce qu'il est obtenu en inactivant la fonction d'au 

moins une proteine impliquee dans la biosynthese de ce ou de ces macrolides dans un 
microorganisme producteur de ce ou de ces macrolide. 
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25) Un autre aspect de Pinveation conceme un microorganisme selon le 
paragraphe 24) ci-dessus caracterise en ce que l'inactivation de cette ou de ces proteines 

_ est effectu6e P ar mutagenese dans le ou les genes codant ladite.au lesdites proteines ou 
par expression d'un ou de plusieurs ARN anti-sens cotnplementaires de PARN ou des 
ARN messagers codant ladite ou lesdites proteines. 

26) Un autre aspect de Pinvention conceme un microorganisme selon le 
paragraphe 25) ci-dessus caracterise en ce que l'inactivation de cette ou de ces proteines 
est effectuee par mutagenese par irradiation, par action d'agent chimique mutagene, par 
mutagenese dirigee ou par remplacement de gene. 

27) Un autre aspect de Pinvention conceme un microorganisme selon le 
paragraphe 25) ou 26) ci-dessus caracterise en ce que la ou les mutageneses sont 
effectuees in vitro ou in situ, par suppression, substitution, deletion et/ou addition d'une 
ou plusieurs bases dans le ou les genes consideres ou par inactivation genique. 

28) Un autre aspect de Pinvention conceme un microorganisme selon le 
paragraphe 23), 24), 25), 26) ou 27) ci-dessus caracterise en ce que ledit 
microorganisme est une bacterie du genre Streptomyces. 

29) Un autre aspect de Pinvention conceme un microorganisme selon le 
paragraphe 23), 24), 25), 26), 27) ou 28) ci-dessus caracterise en ce que le macrolide est 
la spiramycine. 

30) Un autre aspect de Pinvention conceme un microorganisme selon le; 
paragraphe 23), 24), 25), 26), 27), 28) ou 29) ci-dessus caracterise en ce que ledit 
microorganisme est une souche de & ambofaciens. 

31) Un autre aspect de Pinvention conceme un microorganisme selon le 
paragraphe 23), 24), 25), 26), 27), 28), 29) ou 30) ci-dessus caracterise en ce que la 
mutagenese est effectuee dans au moins un gene comprenant une sequence selon Pun 
des paragraphes 1 ), 2), 3), 4), 5) ou 6) ci-dessus. 



m 
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32) Un autre aspect de Finvention concerne un microorganisme selon le 
paragraphe 25), 26), 27) ; 28), 29), 30) ou 31) ci-dessus caracterise en ce que la 
mutagenese est effectuee dans un ou plusieurs genes comprenant une des sequences 
correspondant a une ou plusieurs des sequences SEQ ID N° 3, 5, 7, 9, 11, 13, 15, 17, 

5 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 
78,80,82,84, 107, 109, 111, 113, 115, 118, et 120. 

33) Un autre aspect de F invention concerne un microorganisme selon le 
paragraphe 25), 26), 27), 28), 29), 30), 31) ou 32) ci-dessus caracterise en ce que la : . 
mutagenese consiste en Finactivation genique d'un gene comprenant une sequence 

10 correspondant a la sequence SEQ ID N° 13. 

34) Un autre aspect de l'invention concerne une souche de Streptbmyces 
ambofaciens caracterisee en ce qu'il s'agit d'une souche choisie parmi Furie des ; 
souches deposees aupres de la Collection Nationale de Cultures de Microorgahismes - V 
(CNCM) le 10 juillet 2002 sous le numero d'enregistrement 1-2909, 1-2911, 1-2912, I- 

15 2913, 1-2914, 1-2915, 1-2916 ou 1-2917. 

35) Un autre aspect de Finvention concerne un procede de preparation d'uri 
intermediate de biosynthese de macrolide caracterise en ce qu'il comprend les etapes 
suivantes : 

a) cultiver, dans un milieu de culture approprie, un microorganisme selon Fun des 
20 paragraphs 23), 24), 25), 26), 27), 28), 29), 30), 3 1 ), 32), 33) ou 34) ci dessus, 

b) recuperer le milieu de culture conditionne ou un extrait cellulaire, 

c) separer et purifier a partir dudit milieu de culture ou encore a partir de F extrait 
cellulaire obtenu a Fetape b), ledit intermediaire de biosynthese. 

36) Un autre aspect de Finvention concerne un procede de preparation d'une. 

25 molecule derivee d'un macrolide caracterise en ce que Fon prepare un intermediaire de ; ; ' : 
biosynthese selon le procede du paragraphe 35) ci-dessus et que Fon modifie 
F intermediaire ainsi produit. 
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32") Un ailtTe asnpft r\t* IN 

y _ _ — jr~~ w x vntivu wijivwiiiu uu nuv/i wi ££UiiaiiIC SdUIl 16 

paragraphe 25), 26), 27), 28), 29), 30) ou 31) ci-dessus caracterise en ce que la 
mutagenese est effectuee dans un ou plusieurs genes comprenant une des sequences 
correspondant a une ou plusieurs des sequences SEQ ID N° 3, 5, 7, 9,11, 13, 15, 17, 19, 
21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 
80, 82, 84, 107, 109, 111, 113, 115, 118, et 120. 

33) Un autre aspect de l'invention concerne un microorganisme selon le 
paragraphe 25), 26), 27), 28), 29), 30), 31) ou 32) ci-dessus caracterise en ce que la 
mutagenese consiste en 1'inactivation genique d'un gene comprenant une sequence 
correspondant a la sequence SEQ ID N° 13. 

34) Un autre aspect de l'invention concerne une souche de Streptomyces 
ambofaciens caracterisee en ce qu'il s'agit d'une souche choisie parmi : 

- l'une des souches deposees aupres de la Collection Nationale de Cultures de 
Microorganismes (CNCM) le 10 juillet 2002 sous le numero d'enregistrement 1-2909, 1- 
2911, 1-2912, 1-2913, 1-2914, 1-2915, 1-2916 ou 1-2917 

- la souche SPM5 10. 

35) Un autre aspect de l'invention concerne un procede de preparation d'un 
intermediaire de biosynthese de macrolide caracterise en ce qu'il comprend les etapes 
suivantes : 

a) cultiver, dans un milieu de culture approprie, un microorganisme selon l'un des 
paragraphes 23), 24), 25), 26), 27), 28), 29), 30), 31), 32), 33) ou 34) ci dessus, 

b) recuperer le milieu de culture conditionne ou un extrait cellulaire, 

c) separer et purifier a partir dudit milieu de culture ou encore a partir de l'extrait 
cellulaire obtenu a l'etape b), ledit intermediaire de biosynthese. 

36) Un autre aspect de l'invention concerne un procede de preparation d'une 
molecule derivee d'un macrolide caracterise en ce que 1'on prepare un intermediaire de 
biosynthese selon le procede du paragraphe 35) ci-dessus et que l'on modifie 
Fintermediaire ainsi produit. 
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37) Un autre aspect de ^invention concerne un procede de preparation selon le 
paragraphe 36) ci-dessus caracterise en ce que Ton modifie ledit intermediaire par voie 
chimique, biochimique, enzymatique et/ou microbiologique. 

38) Un autre aspect de V invention concerne un procede de preparation selon le 
5 paragraphe 36) ou 37) ci-dessus caracterise en ce que Ton introduit dans ledit 

microorganisme un ou plusieurs genes codant des proteines susceptibles de modifier 
Pintermediaire en s'en servant comme substrat. 

39) Un autre aspect de 1' invention concerne un procede de preparation selon le 
paragraphe 36), 37) ou 38) ci-dessus caracterise en ce que le macrolide est la 

10 spiramycine. 

40) Un autre aspect de 1' invention concerne un procede de preparation selon le 
paragraphe 36), 37), 38) ou 39) ci-dessus caracterise en ce que le microorganisme 
utilise est une souche de S. ambofaciens. 

s e 

41) Un autre aspect de 1' invention concerne un microorganisme produisant de la 
15 spiramycine I mais ne produisant pas de spiramycine II et III 

42) Un autre aspect de Finvention concerne un microorganisme selon le : 
paragraphe 41) ci-dessus caracterise en ce qu'il coraprend P ensemble des genes 
necessaires a la biosynthese de la spiramycine I mais que le gene comprenaht lai : 
sequence SEQ ID N° 13 ou 1'un de ses variants ou 1'une des sequences derivees de 

20 celles-ci en raison de la degenerescence du code genetique et codant un polypeptide de 
sequence SEQ ID N° 14 ou Tun de ses variants n'est pas exprime ou a ete rendu inactif. 

43) Un autre aspect de Tinvention concerne un microorganisme selon le 
paragraphe 42) ci-dessus caracterise en ce que la dite inactivation est realisee par 
mutagenese dans le gene codant ladite proteine ou par Fexpression d'un ARN anti-sens 

25 complementaire de 1' ARN messager codant ladite proteine. 
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44) Un autre aspect de Pinvention concerne un microorganisme selon le 
paragraphe 43) ci-dessus caracterise en ce que la dite mutagenese est effectuee dans le 
promoteur de ce gene, dans la sequence codante ou dans une sequence non codante de 
maniere a rendre inactive la proteine codee ou a en empecher son expression ou sa 
traduction. V 

45) Un autre aspect de Pinvention concerne un microorganisme selon la 
revendication 43) ou 44) ci-dessus caracterise en ce que la mutagenese est effectuee par 
irradiation, par action d'agent chimique mutagene, par mutagenese dirigee ou par 
remplacement de gene. 

46) Un autre aspect de Pinvention concerne un microorganisme selon le 
paragraphe 43), 44) ou 45) ci-dessus caracterise en ce que la mutagenese est effectuee in 
vitro ou in situ, par suppression, substitution, deletion et/ou addition d'une ou plusieurs 
bases dans le gene considere ou par inactivation genique. 

47) Un autre aspect de l'invention concerne un microorganisme selon le 
paragraphe 41) ou 42) ci-dessus caracterise en ce que ledit microorganisme est obtenu 
en exprimant les genes de la voie de biosynthese de la spiramycine sans que ceux-ci ne 
comprennent le gene comprenant la sequence correspondant a SEQ ID N° 13 ou Pun de 
ses variants ou Pune des sequences derivees de celles-ci en raison de la degenerescence 
du code genetique et codant un polypeptide de sequence SEQ ID N° 14 ou Pun de ses 
variants. 

48) Un autre aspect de Pinvention concerne un microorganisme selon le : 
paragraphe 41), 42), 43), 44), 45), 46) ou 47) ci-dessus caracterise en ce que ledit ; 
microorganisme est une bacterie du genre Streptomyces \ 

49) Un autre aspect de Pinvention concerne un microorganisme selon le 
paragraphe 41), 42), 43), 44), 45), 46), 47) ou 48) ci-dessus caracterise en ce que ledit 
microorganisme est obtenu a partir d'une souche de depart produisant les spiramycines 
I, II et m. 
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50) Un autre aspect de 1'invention concerne un microorganisme selbn le 
paragraphe 41), 42), 43), 44), 45), 46), 47), 48) cm 49) ci-dessus caracterise en ce qu'il 
est obtenu par mutagenese dans un gene comprenant la sequence correspondant a SEQ 
ID N° 13 ou Tun de ses variants ou Tune des sequences derivees de celles-ci en raison 

5 de la degenerescence du code genetique et codant un polypeptide de sequence SEQ ED 
N° 14 ou Tun de ses variants ayant la meme fonction. 

51) Un autre aspect de Pinvention concerne un microorganisme selon le 
paragraphe 41), 42), 43), 44), 45), 46), 47), 48), 49) ou 50) ci-dessus caracterise en ce 
que ledit microorganisme est obtenu a partir d'une souche de S. ambofaciens produisaht 

10 les spiramycines I, II et III, dans laquelle est effectuee une inactivation genique du gene 
comprenant la sequences correspondant a SEQ ID N° 13 ou Tune des sequences 
derivees de celle-ci en raison de la degenerescence du code genetique. * 

52) Un autre aspect de Pinvention concerne une souche de S. ambofaeiens 
caracterisee en ce qu'il s'agit de la souche deposee aupres de la Collection Nationale de 

15 Cultures de Microorganismes (CNCM) le 10 juillet 2002 sous le nuriiero 
d' enregistrement 1-29 10. 

53) Un autre aspect de Pinvention concerne un procede de production de 
spiramycine I, caracterise en ce qu'il comprend les etapes suivantes : 

(a) cultiver, dans un milieu de culture approprie, un microorganisme selon Pun 
20 des paragraphes 41), 42), 43), 44), 45), 46), 47), 48), 49), 50), 51) ou 52) ci-dessus, 

(b) recuperer le milieu de culture conditionne ou un extrait cellulaire, 

(c) separer et purifier a partir dudit milieu de culture ou encore a partir de 
P extrait cellulaire obtenu a Petapeb), la spiramycine I. 

54) Un autre aspect de Pinvention concerne Putilisation d'un polynucleotide selon 
25 Pun des paragraphes 1), 2), 3), 4), 5) ou 6) ci-dessus pour ameliorer la production en 

macrolides d'un microorganisme. 
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55) Un autre aspect de Pinvention concerne un microorganisme mutant 
producteur de macrolide caracterise en ce qu'il possede une modification genetique dans 
au moms un gene comprenant une sequence selon Tun des paragraphes 1), 2), 3), 4), 5) 
ou 6) ci-dessus et/ou qu'il surexprime au moins un gene comprenant une sequence selon 
l'un des paragraphes 1), 2), 3), 4), 5) ou 6) ci-dessus. 

56) Un autre aspect de Pinvention concerne un microorganisme mutant selon le 
paragraphs 55) ci-dessus caracterise en ce que la modification genetique consiste en une 
suppression, une substitution, une deletion et/ou une addition d f une ou plusieurs bases 
dans le ou les genes consideres dans le but d'exprimer une ou des proteines ay ant une 
activite superieure ou d'exprimer un niveau plus eleve de cette ou de ces proteines. 

57) Un autre aspect de Pinvention concerne un microorganisme mutant selon le 
paragraphe 55) ci-dessus caracterise en ce que la surexpression du gene considere est 
obtenue en augmentant le nombre de copie de ce gene et/ou en pla9ant un promoteur 
plus actif que le promoteur sauvage. 

58) Un autre aspect de Pinvention concerne un microorganisme mutant selon le 
paragraphe 55) ou 57) ci-dessus caracterise en ce que la surexpression du gene 
considere est obtenue en transformant un microorganisme producteur de macrolide par 
une construction d'ADN recombinant selon le paragraphe 13, 14 ou 17 ci-dessiiSj 
permettant la surexpression de ce gene. 

59) Un autre aspect de Pinvention concerne un microorganisme mutant selon lei 
paragraphe 55), 56), 57) ou 58) ci-dessus caracterise en ce que la modification : 
genetique est effectuee dans un ou plusieurs genes comprenant une des sequences ": 
correspondant a une ou plusieurs des sequences SEQ ID N° 3, 5, 7, 9, 11, 13, 15, 17, 
19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 
78, 80, 82, 84, 107, 109, 111, 113, 115, 118, et 120, ou Pun de ses variants ouPune des 
sequences derivees de celles-ci en raison de la degenerescence du code genetique. 
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60) Un autre aspect de Finvention concerne un microorganisme mutant selon le 
paragraphe 55), 56), 57), 58) ou 59) ci-dessus caracterise le microorganisme surexprime 
un ou plusieurs genes comprenant une des sequences correspondant a une ou plusieurs 
des sequences SEQ ID N° 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23 3 25, 28, 30, 34, 36, 40, 

5 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 1 1 1, 1 13, 
1 15, 1 18, et 120, ou Tun de ses variants ou Tune des sequences derivees de celles-ci en 
raison de la degenerescence du code genetique. 

61) Un autre aspect de Finvention concerne un microorganisme mutant selon le 
paragraphe 55), 56), 57), 58), 59) ou 60) ci-dessus caracterise en ce que ledit 

10 microorganisme est une bacteries du genre Streptomyces, 

62) Un autre aspect de Pinvention concerne un microorganisme mutant selon le 
paragraphe 55), 56), 57), 58), 59), 60) ou 61) ci-dessus caracterise en ce que le' 
macrolide est la spiramycine. 

63) Un autre aspect de F invention concerne un microorganisme mutant selon le 
15 paragraphe 55), 56), 57), 58), 59), 60), 61) ou 62) ci-dessus caracterise en ce que ledit 

microorganisme est une souches de S. ambofaciens. 

64) Un autre aspect de Finvention concerne un procede de production de 
macrolides, caracterise en ce qu'il comprend les etapes suivantes : 

(a) cultiver, dans un milieu de culture approprie, un microorganisme selon Fun 
20 des paragraphes 55), 56), 57), 58), 59), 60), 61), 62), 63) ou 64) ci-dessus, 

(b) recuperer le milieu de culture conditionne ou un extrait cellulaire, 

(c) separer et purifier a partir dudit milieu de culture ou encore a partir de' 
Pextrait cellulaire obtenu a Petape b), le ou lesdits macrolides produits. 

65) Un autre aspect de Finvention concerne Putilisation d'une sequence et/ou d'un 
25 ADN recombinant et/ou d'un vectenr selon Fun des paragraphes 1), 2), 3), 4), 5), 6), 7), 

8), 9), 10), 11), 12), 13), 14), 15), 16) ou 17) ci-dessus pour la preparation 
d'antibiotiques hybrides. 
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66) Un autre aspect de Pinvention concerne Putilisation d'au moins un 
polynucleotide et/ou au moins un ADN recombinant et/ou au moins un vecteur 
d f expression et/ou au moins un polypeptide et/ou au moins une cellule.h6te selon Pun 
des paragraphes 1), 2), 3), 4), 5), 6), 7), 8), 9), 10), 11), 12), 13), 14), 15), 16), 17) ou 
21) ci-dessus pour realiser une ou plusieurs bioconversions. 

67) Un autre aspect de Pinvention concerne un polynucleotide caracterise en ce 
qu'il s'agit d'un polynucleotide complementaire de Pun des polynucleotides selon le 
paragraphe 1), 2), 3), 4), 5), ou 6) ci-dessus. 

68) Un autre aspect de Pinvention concerne un microorganisme producteur 
d'au moins une spiramycine caracterise en ce qu'il surexprime : 

- un gene susceptible d'etre obtenu par amplification en chaine par 
polymerase (PCR) en utilisant le couple d'amorces de sequence suivante : 5' 
AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ED N° 138) et 5' 
GGATCCCGCGACGGACACGACCGCCGCGCA 3' (SEQ ID N° 139) et comme 
matrice le cosmide pSPM36 ou PADN total de Streptomyces ambofaciens, 

- ou un gene derive de celui-ci en raison de la degenerescence du code 
genetique. 

69) Un autre aspect de Pinvention concerne un microorganisme selon le 
paragraphe 68 caracterise en ce qu'il s'agit d'une bacterie du genre Streptomyces, 

70) Un autre aspect de Pinvention concerne un microorganisme selon le 
paragraphe 68 ou 69 caracterise en ce qu'il s'agit d'une bacterie de Pespece 
Streptomyces ambofaciens. 

71) Un autre aspect de Pinvention concerne un microorganisme selon le 
paragraphe 68, 69 ou 70 caracterise en ce que la surexpression dudit gene est obtenue 
par transformation dudit microorganisme par un vecteur d' expression. 
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72) Un autre aspect de r invention concerne une souche de Streptomyces 
ambofaciens caracterisee en ce qu'il s'agit de la souche OSC2/pSPM75(l) on de la 
souche OSC2/pSPM75(2). 

73) Un autre aspect de r invention concerne un ADN recombinant caracterise 
5 en ce qu'il comprend : 

- un polynucleotide susceptible d'etre obtenu par amplification en chaine par 
polymerase en utilisant le couple d'amorces de sequence suivante : 5' 
AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ID N° 138) et 5' 
GGATCCCGCGACGGACACGACCGCCGCGCA 3' (SEQ ID N° 139) et comme 

10 matrice le cosmide pSPM36 ou PADN total de Streptomyces ambofaciens, 

- ou un fragment d'au moins 10, 12, 15, 18, 20 a 25, 30, 40, 50, 60, 70, 80, \ 
90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850,.. v 
9.00, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1460, 1470, v 
• 1 480, 1490 ou 1 500 nucleotides consecutifs de ce polynucleotide. 

K 

15 74) Un autre aspect de P invention concerne un ADN recombinant selon le ' 

paragraphe 73 caracterise en ce qu'il s'agit d'un vecteur. 

75) Un autre aspect de P invention concerne un ADN recombinant selon le 
paragraphe 73 ou 74 caracterise en ce qu'il s'agit d'un vecteur d'expression. 

76) Un autre aspect de P invention concerne une cellule hote dans laquelle a 
20 ete introduit au moins un ADN recombinant selon Pun des paragraphes 73, 74 ou 75. 

77) Un autre aspect de Pinvention concerne un procede de production d'un 
polypeptide caracterise en ce que ledit procede comprend les etapes suivantes: 

a) transformer une cellule hote par au moins un vecteur d'expression selon le 
paragraphe 75; 

25 b) cultiver, dans un milieu de culture approprie, ladite cellule hote; 

c) recuperer le milieu de culture conditionne ou un extrait cellulaire; 
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d) separer et purifier a partir dudit milieu de culture ou encore a partir de 
Pextrait ceiiuiaire obtenu a Petape c), ledit polypeptide ; 

e) le cas echeant, caracteriser le polypeptide recombinant produit. 

78) Un autre aspect de Pinvention concerne un microorganisme selon le 
5 paragraphe 51 caracterise en ce que l'inactivation genique est effectuee par deletion 

en phase du gene ou d'une partie du gene comprenant la sequence correspondant a 
SEQ ID N° 13 ou Pune des sequences derivees de celle-ci en raison de la 
degenerescence du code genetique. 

79) Un autre aspect de Pinvention concerne un microorganisme selon Pun 
10 des paragraphs 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51 ou 78 caracterise en ce en 

ce qu'il surexprime en outre : 

- un gene susceptible d'etre obtenu par amplification en chaine par polymerase en 
utilisant le couple d' amorces de sequence suivante : 5' 
AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ID N° 138) et 5' 

15 GGATCCCGCGACGGACACGACCGCCGCGCA 3' (SEQ ID N° 139) et comme 
matrice le cosmide pSPM36 ou P ADN total de Streptornyces ambofaciens. 

- ou un gene derive de celui-ci en raison de la degenerescence du code genetique. 

80) Un autre aspect de Pinvention concerne un vecteur d ' expression . 
caracterise en ce que le polynucleotide de sequence SEQ ID N° 47 ou un 

20 polynucleotide derive de celui-ci en raison de la degenerescence du code genetique 
est place sous le contrdle d'un promoteur permettant P expression de la proteine 
codee par le dit polynucleotide chez Streptornyces ambofaciens. 

81) Un autre aspect de Pinvention concerne un vecteur d'expression selon le 
paragraphe 80 caracterise en ce qu'il s'agit du plasmide pSPM524 ou pSPM525. 

25 82) Un autre aspect de Pinvention concerne une souche de Streptornyces 

ambofaciens transformer par un vecteur selon le paragraphe 80 ou 81 . 
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83) Un autre aspect de Pinvention conceme un microorganisme selon Pun des 
paragraphes 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 78 ou 79 caracterise en ce qu'il 
surexprime en outre le gene de sequence codante SEQ ID N° 47 ou d'une sequence 
codante derivee de celle-ci en raison de la degenerescence du code genetique. 

5 . 84) Un autre aspect de 1'invention concerne un microorganisme selon le 

paragraphs 83 caracterise en ce qu'il s'agit de la souche SPM502 pSPM525 deposee 
aupres de la Collection Nationale de Cultures de Microorganismes (CNCM) Institut 
Pasteur, 25, rue du Doeteur Roux 75724 Paris Cedex 15, France, le 26 fevrier 2003 
sous le numero d'enregistrement 1-2977. 

10 85) Un autre aspect de Finvention concerne un precede de production de 

spiramycine(s), caracterise en ce qu'il comprend les etapes suivantes : 1 ■ 

(a) cultiver, dans un milieu de culture approprie, un microorganisme selon Tun 
des paragraphes 68, 69, 70, 71, 72, 78, 79, 82, 83 ou 84, „v 

(b) recuperer le milieu de culture conditionne ou un extrait cellulaire, 

15 (c) separer et purifier a partir dudit nailieu de culture ou encore a partir de 

l'extrait cellulaire obtenu a Petape b), les spiramycines. 

s 

86) Un autre aspect de Pinvention concerne un polypeptide caracterise en ce que 
sa sequence comprend la sequence SEQ ID N° 1 12. 

87) Un autre aspect de Pinvention concerne un polypeptide caracterise en ce 
20 que sa sequence correspond a la sequence traduite de la sequence codante : 

- d'un gene susceptible d'etre obtenu par amplification en chaine par 
polymerase (PCR) en utilisant le couple d'amorces de sequence suivante : 5\ 
AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ID N° 138) et 5 9 
GGATCCCGCGACGGACACGACCGCCGCGCA 3' (SEQ ID N° 139) et comme 
25 matrice le cosmide pSPM36 ou PADN total de Streptomyces ambofaciens, 

-ou d'un gene derive de celui-ci en raison de la degenerescence du code 
genetique. 



1er depot 



20 

88) Un autre aspect de Pinvention conceme un vecteur depression permettant 
P expression d'un polypeptide selon le paragraphe 86 ou 87 chez Streptomyces 
ambofaciens, 

89) Un autre aspect de Pinvention- conceme un vecteur d' expression selon le 
5 paragraphe 88 caracterise en ce qu'il s'agit du plasmide pSPM75. 

Definitions generates 

Le terme " isole " au sens de la presente invention designe un materiel biologique 
(acide nucleique ou proteine) qui a ete soustrait a son environnement originel 
10 (P environnement dans lequel il est localise naturellement). 

Par exemple un polynucleotide present a Petat naturel dans une plante ou tin' 
animal n'est pas isole. Le raeme polynucleotide separe des acides nucleiques adjacents 
au sein desquels il est naturellement insere dans le genome de la plante ou P animal est 
considere comme " isole " 

15 Un tel polynucleotide peut etre inclus dans un vecteur et/ou un tel polynucleotide^ 

peut etre inclus dans une composition et demeurer neanmoins a Petat isole du fait que le 
vecteur ou la composition ne constitue pas son environnement naturel. 

Le terme " purifie 5) ne necessite pas que le materiel soit present sous une forme de 
purete absolue, exclusive de la presence d'autres composes. Il s'agii plutdt d'une 
20 definition relative. 

Un polynucleotide est a Petat " purifie " apres purification du materiel de depart 
ou du materiel naturel d'au moins un ordre de grandeur, de preference 2 ou 3 et 
preferentiellement 4 ou 5 ordres de grandeur. 
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Aux fins de la presente invention le terme ORF (« Open Reading Frame », c'est a 
dire cadre ouvert de lecture) a ete employe pour designer en particulier la sequence 
codante d'un gene. 

Aux fins de la presente description, l'expression " sequence nucleotidique " peut 
5 etre employee pour designer indifferemment un polynucleotide ou un acide nucleique. 
L'expression " sequence nucleotidique " englobe le materiel genetique lui-meme et n'est 
done pas restreinte a 1' information concemant sa sequence. 

Les termes " acide nucleique " polynucleotide '\ " oligonucleotide 99 ou encore " 
sequence nucleotidique " englobent des sequences d'ARN, d'ADN, d'ADNc ou encore 
10 des sequences hybrides ARN/ADN de plus d'un nucleotide, indifferemment sous la 
forme simple chaine ou sous la forme de duplex. . * 

Le terme " nucleotide " designe a la fois les nucleotides naturels (A, T, G, C) ainsi 
que des nucleotides modifies qui comprennent au moins une modification telle que (1) 
un analogue d'une purine, (2) un analogue d'une pyrimidine, ou (3) un sucre analogue, 
15 des exemples de tels nucleotides modifies etant decrits par exemple dans la demande 
PCTN°WO 95/04 064. 

Aux fins de la presente invention, un premier polynucleotide est considere comme 
etant " complementaire " d'un second poljmucleotide lorsque chaque base du premier 
polynucleotide est appariee a la base complementaire du second polynucleotide dorit 
20 T orientation est inversee. Les bases complementaires sont A et T (ou A et U), ou C et G. 

Le terme « genes de la voie de biosynthese des spiramycines » comprend 
egalement les genes regulateurs et les genes conferant la resistance aux microorganismes 
producteurs. 

On entendra par " fragment " d'un acide nucleique de reference selon Pinventiori, 
25 une sequence nucleotidique de longueur reduite par rapport a 1' acide nucleique de 
reference et comprenant, sur la partie commune, une sequence en nucleotides identique a 
P acide nucleique de reference. 
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Un tel " fragment " d'acide nucleique selon Pinvention peut etre le cas echeant, 
compris dans un polynucleotide plus grand duquel il est constitutif. 

De tels fragments comprennent ou alternativement consistent "en, des 
polynucleotides de longueur allant de 8, 10, 12, 15, 18, 20 a 25, 30, 40, 50, 60, 70, 80, 
5 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 
950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 
1650, 1700, 1750, 1800, 1850 ou 1900 nucleotides consecutifs d'un acide nucleique 
selon Pinvention. 

Par " fragment " d'un polypeptide selon Pinvention, on entendra un polypeptide 
10 dont la sequence d'acides amines est plus courte que celle du polypeptide de reference et 
qui comprend sur toute la partie commune avec ces polypeptides de reference, une 
sequence en acides amines identique. 

De tels fragments peuvent, le cas echeant, etre compris au sein d'un polypeptide . 
plus grand duquel ils font partie. 

15 De tels fragments d'un polypeptide selon Pinvention peuvent avoir une longueur 

de 10, 15, 20, 30 a 40, 50, 60, 70, 80, 90,100, 120, 140, 160, 180, 200, 220, 240, 260, 
280, 300, 320, 340, 360, 380, 400, 420, 440, 460, 480, 500, 520, 540, 560, 580, 600, 620 ■ 
ou 640 acides amines. 

Par " conditions d'hybridation de forte stringence " au sens de la presente 
20 invention, on entendra des conditions d'hybridation defavorisant Phybridation de brins 
d' acides nucleiques non homologues. Des conditions d'hybridations de forte stringence 
peuvent etre par exemple decrites comme des conditions d'hybridation dans le tampon 
decrit par Church & Gilbert (Church & Gilbert, 1984) a une temperature comprise entre 
55°C et 65°C, de maniere preferee la temperature d'tryridation est de 55°C, de maniere 
25 encore plus preferee la temperatue d'hybridation est de 60°C et de maniere tout a fait ; 
preferee la temperature d'hybridation est de 65°C, suivi d'un ou plusieurs lavages 
effectue en tampon 2X SSC (le tampon IX SSC correspond a une solution aqueuse 
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0,1 5M NaCl, 15 mM de citrate de sodium) a une temperature comprise entre 55°C et 
65°C, de maniere preferee cette temperature est de 55°C, de maniere encore plus 
preferee cette temperatue est de 60°C et de maniere tout a fait preferee cette temperature 
est de 65°C, suivi d'un ou plusieurs lavages en tampon 0.5X SSC a une temperature 
5 comprise entre 55°C et 65°C, de' maniere preferee cette temperature est de 55°C, de 
maniere encore plus preferee cette temperatue est de 60°C et de maniere tout a fait 
preferee cette temperature est de 65°C. 

II va sans dire que les conditions d 'hybridation ci-dessus decrites peuvent etre 
adaptees en fonction de la longueur de l'acide nucleique dont 1 'hybridation est 
10 recherchee ou du type de marquage choisi, selon des techniques connues de l'homme du 
metier. Les conditions convenables d'hybridation peuvent par exemple etre adaptees 
selon Pouvrage de F. Ausubel et al (2002). 

* '.*• 

Par " variant " d'un acide nucleique selon 1'invention, on entendra un- acide 
nucleique qui differe d'vme ou plusieurs bases par rapport au polynucleotide de 
15 reference. Un acide nucleique variant peut etre d'origine naturelle, tel qu'un vanant 
allelique retrouve naturellement, ou peut etre aussi un variant non naturel obtenu par 
exemple par des techniques de mutagenese. 

En general, les differences entre l'acide nucleique de reference et l'acide nucleique 
variant sont reduites de telle sorte que les sequences nucleotidiques de l'acide nucleique 
20 de reference et de l'acide nucleique variant sont tres proches et 3 dans de nombreuses 
regions, identiqiies. Les modifications de nucleotides presentes dans un acide nucleiqxi£ 
variant peuvent etre silencieuses, ce qui signifie qu'elles n'alterent pas les sequences 
d'aminoacides codees par ledit acide nucleique variant. 

Cependant, les changements de nucleotides dans un acide nucleique variant 
25 peuvent aussi resulter de substitutions, additions, deletions dans le polypeptide code par 
l'acide nucleique variant par rapport aux peptides codes par l'acide nucleique de 
reference. En outre, des modifications de nucleotides dans les regions codantes peuvent 
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produire des substitutions, conservatives ou non conservatives dans la sequence 
d'aminoacides. 

De preference, les acides nucleiques variants selon Pinvention codent des 
polypeptides qui conservent sensiblement la meme fonction ou activite biologique que le 
polypeptide de 1'acide nucleique de reference ou encore la capacite a etre reconnus par 
des anticorps diriges contre les polypeptides codes par Pacide nucleique initial. 

Certains acides nucleiques variants coderont ainsi des formes mutees des 
polypeptides dont P etude systematique permettra de deduire des relations structure 
activite des proteines en question. 

Par " variant " d'un polypeptide selon Pinvention, on entendra principalement uii 
polypeptide dont la sequence d' acides amines contient une ou plusieurs substitutions, 
additions ou deletions d'au moins un residu d'acide amine, par rapport a la sequence 
d'acides amines du polypeptide de reference, etant entendu que les substitutions 
d'aminoaeides peuvent etre indifferemment conservatives ou non conservatives. 

De preference, les polypeptides variants selon l'invention conservent sensiblement 
la meme fonction ou activite biologique que le polypeptide de reference ou encore la 
capacite a etre reconnus par des anticorps diriges contre les polypeptides initiaux. 

Par polypeptide ayant " une activite similaire "aim polypeptide de reference au 
sens de P invention, on entend un polypeptide ayant une activite biologique proche, mais \ 
pas necessairement identique, de celle du polypeptide de reference tel que mesur6 dans 5 
un essai biologique convenable a la mesure de P activite biologique du polypeptide de 
reference. 

Par 66 antibiotique hybride " au sens de Pinvention on entend un compose, genere ■ 
par la construction d'une voie de biosynthese artificielle utilisant la technologie de 
PADN recombinant. 
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Description detaillee de Pinvention 

La presente invention a plus particulierement pour objet, de nouveaux genes de la 
voie de biosynthese des spiramycines et de nouveaux polypeptides impliques dans cette 
biosynthese tels que presentes dans, la description detaillee ci-dessous. 

5 Les genes de la voie de biosynthese ont ete clones et la sequence d'ADN de ces 

genes a ete determinee. Les sequences obtenues ont ete analysees grace au programme 
FramePlot (Ishikawa J & Hotta K. 1999). On a identifie, parmi les phases ouvertes de 
lecture, les phases ouvertes de lecture presentant un usage des codons typiques de 
Streptomyces. Cette analyse a montre que cette region comporte 42 ORFs localisees de 

10 part et d'autre de cinq genes codant P enzyme « polyketide synthase » (PKS). De part et 
d'autre de ces cinq genes codant des PKS, respectivement 10 et 32 ORFs ont, ete 
identifies en aval et en amont (l'aval et Pamont etant definis par r orientation des 5 
genes de PKS tous orientes dans le meme sens) (cf. figure 3 et 37). Ainsi, les 32 phases 
ouvertes de lecture de ce type, occupant une region d' environ 40 kb (cf. SEQ ID N° 1 

15 presentant une premiere region de 31 kb contenant 25 ORFs et SEQ ID N° 106 
presentant une region d'environ 10,3 kb dont 1402 pb chevauchent la sequence 
precedente (SEQ ID N° 1) et environ 9 kb correspondent a la suite de la sequence (avec 
cependant un region d'environ 450 nucleotides dont la sequence n'a pas ete determinee 
(region symbolisee par des « N » dans ladite sequence)), cette derniere partie de 9 kb 

20 contenant 7 ORFs supplementaires (dont un ORF de sequence partielle, due a la region 
indeterminee), cf. egalement figure 3 et 37 et ci-dessous), ont ete identifiees en amont 
des 5 genes codant la PKS et 10 occupant une region d'environ 1 1,1 kb (SEQ ID N° 2 et 
figure 3), ont ete identifiees en aval des genes de la PKS. Les 10 genes situes en aval des 
5 genes PKS ont ainsi ete nornmes orfl*c f orf2*c, orf3*c, orf4*c, or/5* or/6*, orp*c, 

25 orf8*, or/9% orflO* (SEQ ID N° 3, 5, 7, 9, 11, 13, 15, 17, 19 et 21). Le « c » ajoute dans 
le nom du gene signifiant pour PORF en question que la sequence codante est dans 
l'orientation inverse (le brin codant est done le brin complementaire de la sequence 
donnee en SEQ ID N° 2 pour ces genes). En utilisant la meme nomenclature, les 32 
ORFs en amont des genes de la PKS ont ete nornmes orfl, or/2, or/3, or/4, orf5> orf6, 
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orf7 f orf8, orflc, orflO, orfll c, orfl2, orfl3c, orfl4, orf!5c, orfl6, orfll, orfl8, orfl9, 
orf20 f orfilc, orf22c t or/2 3c, orf24c, orf25c, or/26, orf27, orf28c, orf29, orf30c, or/31 
et orf32c (SEQ ID N° 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 
70, 72, 74, 76, 78, 80, 82,54,107,. 109, 111, 113, 115, 118, et 120) (cf. figure 3 et 37). 

5 Les sequences proteiques deduites de ces phases ouvertes de lecture ont ete 

cornparees avec celles presentes dans differentes bases de donnees grace a differents 
programmes : BLAST (Altschul et aL y 1990) (Altschul et ah, 1997), CD-search, COGs 
(Cluster of Orthologous Groups) (ces trois programmes sont accessibles notamment 
aupres du National Center for Biotechnology Information (NCBI) (Bethesda, Maryland, 

10 USA)), FASTA ((Pearson W. R & D. J. Lipman, 1988) et (Pearson W. R., 1990), 
BEAUTY (Worley K. C et al, 1995)), (ces deux programmes sont accessibles 
notamment aupres du centre de ressourc.es INTOBIOGEN, Evry, France), Ces 
comparaisons ont permis de formuler des hypotheses sur la fonction des produits de ces 
genes et d' identifier ceux susceptibles d'etre impliques dans la biosynthese des 

15 spiramycines. 

Genes situes en aval des genes codant les PKS 

Une representation schematique de Torganisation de la region est presentee eri 
figure 3. Ainsi qu'il sera demontre ci-dessous, sur les 10 genes identifies en aval des 
genes codant les PKS 9 semblent impliques dans la biosynthese ou la resistance aux 
20 spiramycines. II s'agit des 9 genes suivants ; orfl*c, orf2*c, or/3*c, orf4*c, or/5* orf6*> 
orf7*c f or/8* et or/P* 

Dans le tableau 1 suivant sont presentees les references a la sequence en ADN et 
en acides amines des 10 genes identifies en aval des 5 genes PKS. 



Tableau 1 



Gene 


Position dans la 
sequence SEQ ID N 2 


Sequence ADN 


Sequences polypeptidiques 


orfl*c 


10882 a 10172 


SEQ ID N 3 


SEQ ID N 4 
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orf2*c 


10052 a 8781 


SEQIDN 5 


SEQIDN 6 


orf3*c 


8741 a 7476 


SEQ IDN 7 


SEQIDN 8 


or/4*c 


7459 a 6100 


SEQIDN 9 


SEQIDN 10 


orf5* 


5302 a 5976 


SEQIDN 11 


SEQIDN 12 


orf6* 


4061 a 5305 


SEQIDN 13 


SEQIDN 14 


orf7*c 


3665 a 2817 


SEQIDN 15 


SEQIDN 16 


orf8* 


1925 a 2755 


SEQIDN 17 


SEQIDN 18 


or/9* 


1007 a 1888 


SEQIDN 19 


SEQIDN 20 


or/20* 


710 a 937 


SEQIDN 21 


SEQIDN 22 



Le « c » ajoute dans le nom du gene indique que la sequence codante est dans 
r orientation inverse (le brin codant est done le brin complementaire de la sequence 
donnee en SEQ ID N° 2 pour ces genes). 



Dans le but de determiner la fonction des polypeptides identifies, trois types 
5 d'experiences ont ete menes : la comparaison des sequences identifiees avec .des 
sequences de fonctions connues, des experiences deactivation de genes, conduisant a la 
construction de souches mutantes et des analyses de la production en spiramycines et eh 
intermediaires de biosynthese des spiramycines par ces souches mutantes. 

Les sequences proteiques deduites de ces phases ouvertes de lecture ont tout 
10 d'abord ete comparees avec celles presentes dans differentes bases de donnees grace a 
differents programmes : BLAST (Altschul et aL, 1990) (Altschul et aU 1997), CD- 
search, COGs (Cluster of Orthologous Groups), FASTA ((Pearson W. R & D. J. 
Lipman, 1988) et (Pearson W. R., 1990), BEAUTY (Worley K. C. et al, 1995)). Ces 
comparaisons ont permis de formuler des hypotheses sur la fonction des produits de ces 
15 genes et d'identifier ceux susceptibles d'etre impliques dans la biosynthese de 
spiramycins Le tableau 2 montre les proteines presentant une forte similitude avec les 
produits 10 genes situes en aval des 5 genes PKS. 
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Tableau 2 



Produit 
de gene 


Proteine presentant une 
similitude significative 


Numero d'acces 
GenBank 


Score 
BLAST* 


Fonction rapportee 


orfl*c 


TylMI(orf3*) (S.fradiae) 


CAA57473 


287 


N- 

methyltransferase 


orf2*c 


dnrQ gene product 
(Streptomyces peucetius) 


AAD 15266 


153 


Inconnue 


orf3*c 


TylMII(orf2*) (S.fradiae) 


CAA57472 


448 


Glycosyltransferas 
e 


orf4*c 


Crotonyl-CoA reductase 
(S. coelicolor) 


NP_630556 


772 


Crotonyl-CoA 
reductase 


or/5* 


MdmC (S. mycarofaciens) 


B42719 


355 


O 

methyltransferase 


or/6* 


3-O-acyltransferase (S, 
mycarofaciens) 


Q00718 


494 


Acyltransferase 


orfi*c 


MdmA (S. 

mycarofaciens) 


A60725 


380 


Proteine impliquee 
dans la resistance 
a la midecamycine 


or/8* 


ABC-transporteur (S. 
griseus) 


CAC22119 


191 


AB Otransporteur 


or/9* 


ABC-transporteur (S. 
griseus) 


CAC22118 


269 


AB C-transporteur 


orfJO* 


Putative small conserved 
hypothetical protein (S. 
coelicolor) 


NP_627432 


109 


Inconnue 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al, 1990). 



Des experiences deactivation de genes ont ete realisees pour confirmer ces resultats. 
Les methodes utilisees consistent a effectuer un remplacement de gene. Le gene cible a 
interrompre est remplace par une copie de ce gene interrompue par une cassette 
conferant la resistance a un antibiotique (par exemple Tapramycine, la geneticine ou 
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l'hygromycine). Les cassettes utilisees sont bordees de part et d'autre par des codons de 
terminaison de la traduction dans toutes les phases de lecture et par des termmateurs de 
transcription actifs chez Streptomyces. L'insertion de la cassette dans le gene cible pent 
s'accompagner ou non d'une deletion dans ce gene cible. La taille des regions flanquant 

5 la cassette peut aller de quelques centaines a plusieurs milliers de paires de bases. Un 
deuxieme type de cassettes peut etre utilise pour 1'inactivation de genes : des cassettes 
dites « cassettes excisables ». Ces cassettes presentent l'avantage de pouvoir etre 
excisees chez Streptomyces par un evenement de recombinaison de site specifique apres 
avoir ete introduites dans le genome de S. ambofaciens. Le but est d'inactiver certains 

10 genes dans des souches de Streptomyces sans laisser dans la souche finale de marqueurs 
de selection ou de grandes sequences d'ADN n'appartenant pas a la souche. Apres 
excision il subsiste uniquement une courte sequence d'une trentaine de paires de bases 
(appele site « cicatriciel ») dans le genome de la souche (cf. figure 10). La mise en 
oeuvre de ce systeme consiste, dans un premier temps, au remplacement de la copie 

15 sauvage du gene cible (grace a deux evenements de recombinaison homologue, cf. 
figure 9) par une construction dans laquelle une cassette excisable a ete inseree dans ce 
gene cible. L'insertion de cette cassette est accompagnee d'une deletion dans le gene 
cible (cf. figure 9). Dans un deuxieme temps, Pexcision de la cassette excisable du 
genome de la souche est provoquee. La cassette excisable fonctionne grace a un systeme 

20 de recombinaison site specifique et a pour avantage de permettre V obtention de mutants 
de Streptomyces ne portant fmalement pas de gene de resistance. On s'affranchit 
egalement d'eventuels effets polaires sur 1' expression des genes situes en aval du ou des 
genes inactives (cf. figure 10). Les souches ainsi construites ont ete testees pour leur 
production en spiramycines. 

25 L'inactivation des genes orfl*c, orfl*c, orfi*c et orf4*c n'a pas ete effectuee car 

les experiences de comparaison de sequence ont permis de determiner que ces genes 
avaient une similitude relativement importante avec des genes impliques dans la 
biosynthese d'un antibiotique relativement proche. Ainsi, le gene orfl*c code une 
proteine presentant une identite de 66% (determines grace au programme BLAST) avec 

30 la proteine codee par gene tylMI qui code une N-methyltransferase impliquee dans la 
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biosynthese de tylosine et catalysant la 3 N-methylation durant la production du 
mycaminose chez Streptomyces fradiae (Gandecha,A-R- et al, 1997 ; Numero d'acces 
GenBank : CAA57473 .;. Score BLAST : 287). Cette similitude avec une proteine 
- impliquee dans, la voie .de biosynthese d'un autre antibiotique relativement proche et 
5 plus particulierement dans la biosynthese du mycaminose suggere que le gene orfl*c 
code une N-methyltransferase responsable d'une N-methylation lors de la biosynthese de 
la forosamine ou du mycaminose (cf. figure 5 et 6). Cette hypothese est etayee par le fait 
que la proteine codee par le gene orfl*c pr6sente une forte similitude avec d'autres 
proteines de fonction similaire chez d'autres organismes (cf. tableau 3). 

10 Tableau 3 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


methyltransferase (S. antibioticus) 


CAA05643 


277 


methyltransferase 


N ? N-dimethyltransferase (S. venezuelae) 


AAC68678 


268 


N,N- 

dimethyltransferase 


probable N-methylase snogX (S. 
nogalater) 


T46679 


243 


N-methyltransferase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al, 1990). 



Le gene orf2*c code une proteine presentant une relative forte similitude (35% 
d'identite) avec une proteine codee par le gene tylMlII codant une NDP hexose 3,4 
15 isomerase impliquee dans la biosynthese de la tylosine chez Streptomyces fradiae 
(Gandecha 5 A.R., et al, 1997 ; Numero d'acces GenBank : CAA57471 ; Score BMAST : 
130). Cette similitude avec une proteine impliquee dans la voie de biosynthese d'un 
autre antibiotique proche et plus particulierement dans la biosynthese du mycaminose 
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suggere fortement que le gene orf*2c code une NDP hexose 3,4 isomerase responsable 
d'isomerisation lors de la biosynthese du mycaminose (cf. figure 5). 

Le gene orfi*c code une proteine presentant une relative forte similitude (59% 
d'identite) avec une proteine codee par le gene tylMU codant une glycosyltransferase 
impliquee dans la biosynthese de la tylosine chez Streptomyces fradiae (Gandecha,AR- 
et al, 1997 ; Numero d"acces GenBank : CAA57472 ; Score BLAST: 448). Cette 
similitude avec une proteine impliquee dans la voie de biosynthese d'un autre 
antibiotique proche suggere fortement que le gene orf*3c code une glycosyltransferase. ■ 
Cette hypothese est etayee par le fait que la proteine codee par le gene orf3*c presente ; : 
une forte similitude avec d'autres proteines de fonction similaire chez d'autres 
organismes (cf. tableau 4). 



Tableau 4 



Proteine presentant une similitude 
significative 


Numero 

cTacces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


Glycosyl transferase (S. venezuelae) 


AAC68677 


426 


Glycosyltransferase 


Glycosyltransferase (5. antibioticus) 


CAA05642 


425 


Glycosyltransferase 


Glycosyltransferase 
(Saccharopolyspora erythraea) 


CAA74710 


395 


Glycosyltransferase 


Glycosyltransferase (& antibioticus) 


CAA05641 


394 


Glycosyltransferase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al. , 1 990) . 



Le gene orf4*c code une proteine presentant une relative forte similitude avec : 
plusieurs crotonyl-CoA reductases. Notamment, la proteine codee par orf4*c possede 
une similitude importante avec une crotonyl CoA reductase de chez Streptomyces 
coelicolor (Redenbach,M et al., 1996 ; Numero d'acces GenBank : NP_630556 ; Score 
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BLAST : 772). Cette similitude avec une proteine impliquee dans la voie de biosynthese 
d'un autre antibiotique proche suggere fortement que le gene orf4*c code egaiement me 
crotonyl-CoA reductase. Cette hypothese est etayee par le fait que la proteine codee par 
le gene orf4*c presente une forte similitude avec d'autres proteines de fonction similaire 
5 cbez d'autres organismes (cf. tableau 5). 



Tableau 5 



Proteine presentant une similitude 
significative 


Numero 
d'acces 
GenBank 


Score 
BLAST* 


Fonction rapportee 


trans-2-enoyl-CoA reductase 
(EC1.3.L38)(£ collinus) 


S72400 


764 


trans-2-enoyl-CoA 
reductase 


Crotonyl Co A reductase (S.fradiae) 


CAA57474 


757 


Crotonyl CoA reductase 


Crotonyl-CoA reductase (St. 
cinnamonensis) 


AAD53915 


747 


Crotonyl-CoA reductase 



* une plus grande similitude de sequence est associee a un score BLAST plus 



eleve (Altschul et al. 9 1990). 

Le gene orf5* presente une certaine similitude avec le gene mdmB present chez 
10 Streptomyces mycarofaciens (Hara et Hutchisnson, 1992 ; numero d'acces GenBank : 
A42719 ; Score BLAST : 489) producteur d' antibiotique macrolide. Chez ce producteur, 
le gene est implique dans l'acylation du cycle lactone. Le gene orf6* coderait done une 
acyltransferase. Cette hypothese est etayee par le fait que la proteine codee par le gene 
or/6* presente une forte similitude avec d'autres proteines de fonction similaire chez ; 
15 d'autres organismes (cf. tableau 6). 
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Tableau 6 



Proteine presentant une 
similitude significative 


Numero 
d'acces 
GenBank 


Score 
BLAST* 


Fonction rapportee 


AcyA (Streptomyces 
thermotolerans) 


J4001 


450 


macrolide 3 -O-acyltransferase 


Midecamycine 4"-0- 
propionyl transferase (S. 
mycarofaciens) 


BAA09815 


234 


Midecamycine 4 ,, -0-propionyl 
transferase 


Mycarose O-acyltransferase 
(Micromonospora 
megalomicea subsp. Nigra) 


AAG13909 


189 


Mycarose O-acyltransferase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et aL, 1990). 

L'inactivation du gene or/6* a ete realisee par une deletion/insertion en phase et il 
5 a ete montre que la souche resultante ne produit plus de spiramycine II et IE mais 
uniquement de la spiramycine I (cf figure 1). Ceci confirme que le gene orf6* est bien 
implique dans la synthese de spiramycine n et HI. L' enzyme codee par ce gene est 
responsable de la formation de spiramycine H et HI par fixation d'un groupement acetyl 
ou butyryl sur le carbone 3. Les souches n'exprimant plus la proteine codee par le gene 
10 orf6* sont particulierement interessantes puisqu'elles ne produisent plus de spiramycine 
H et HI mais seulement de la spiramycine I. Comme il a ete precise ci-dessus, l'activite 
antibiotique de la spiramycine I est nettement superieure a celle des spiramycines H et m 
(Liu etai, 1999). 

Le gene orfS* code une proteine presentant une relative forte similitude avec 
15 plusieurs O-methyltransferase. Notamment, la proteine codee par orf5* possede une 
similitude importante avec une O-metbyltransferase (EC 2.1.1.-) MdmC de 
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Streptomyces mycarofaciens (Hara & Hutchinson, 1992; Numero d'acces 
GenBank :B42719; Score BLAST : 355). Cette similitude avec une proteine impliquee 
_dans la vpie de biosynthese d'un autre antibiotique _suggere fortement que le gene orfS * 
code egalement une O-methyltransferase. Le gene or/5* serait implique dans la 

5 formation de precurseurs incorpores dans le cycle lactone. En effet, d'apres les 
comparaisons de sequences, le produit du gene orf5* est egalement relativement proche 
de FkbG qui est responsable de la methylation de l'hydroxymalonyl-ACP d'apres (Wu et 
ah, 2000 ; Hoffineister et al, 2000 ; Numero d'acces GenBank : AAF86386 ; Score 
BLAST : 247) (cf. figure 8). Cette hypotbese est etayee par le fait que la proteine codee 

10 par le gene orp* presente une forte similitude avec d'autres proteines de fonction 
similaire chez d'autres organismes (cf. tableau 7). 



Tableau 7 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee , 


Probable O-methyltransferase (EC 
2.1.1.-) safC (Myxococcus xanthus) 


T18553 


223 


O-metbyltransferase 


4-O-methyltransferase (EC 2.1.1.-)- 
(Streptomyces sp.) 


JC4004 


222 


O-methyltransferase 



* une plus grande similitude de sequence est associee a un score BLAST plus 



eleve (Altschul et aL, 1990). 

15 Grace a l'effet polaire de l'insertion d'une cassette non excisee dans le gene or/6*, 

il a pu etre determine que le gene orf 5* est essentiel a la voie de biosynthese des 
spiramycines. En effet, l'insertion de la cassette excisable dans la partie codante du gene 
orf 6* entraine un arret total de la production en spiramycines. Cependant, une fois que 
la cassette inseree a ete excisee (et done lorsque seul le gene orf6* est inactive, cf 

20 exemples 14 et 15), on retrouve une production en spiramycine I. Ceci montre que le 
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gene orf 5* est essentiel a la voie de biosynthese des spiramycines puisque son 
inactivation entraine un arret total de la production en spiramycines. 

Le gene orp*c code une proteine presentant une relative forte similitude avec une 
proteine codee par le gene mdmA de Streptomyces mycarofaciens, ce dernier codant une 
proteine impliquee dans la resistance a la midecamycine chez cet organisme producteur 
(Hara et al, 1990 ; Numero d'acces GenBank : A60725 ; Score BLAST : 380). Cette 
similitude avec une proteine impliquee dans la voie de biosynthese d'un autre 
antibiotique suggere fortement que le gene orf7*c code egalement une proteine 
impliquee dans la resistance a la spiramycine. Plus particulierement, 1' enzyme cod6e par 
le gene orp*c possede une activite methyltransferase et est impliquee dans la resistance 
a la spiramycine chez Streptomyces ambofaciens. II a ete demontre que ce gene confere 
une resistance de type MLS I, resistance dont on sait qu'elle est due a la mono- 
methylation en position A2058 de l'ARN ribosomal 23S (Pernodet et al, 1996): Cette 
hypothese est etayee par le fait que la proteine codee par le gene or/7*c presente une 
forte similitude avec d'autres proteines de fonction similaire chez d'autres organismes 
(cf. tableau 8). 



Tableau 8 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


maerolide-linGGsamide-streptograniinB 
resistance detemiinant (S. fradiae) 


JC5319 


238 


23 S rRNA 
methyltransferase 


23 S ribosomal RNA methyltransferase 
ErmML {Micrococcus luteus) 


AAL68827 


119 


23 S rRNA 
methyltransferase . 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al, 1990). 
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Le gene or/8* code une proteine presentant une relative forte similitude avec une 
proteine de type transporteur ABC chez Streptomyces griseus (Campelo, 2002, Numero 
d'acces GenBank : CAC22119 ; Score BLAST : 191). Cette similitude avec une proteine 
de type transporteur ABC suggere fortement que le gene or/8* code egalement une 
proteine de type transporteur ABC pouvant etre impliquee dans la resistance a la 
spiramycine. Cette hypothese est etayee par le fait que la proteine codee par le gene 
orf8* presente une forte similitude avec d'autres proteines de fonction similaire chez 
d'autres organismes (cf. tableau 9). 

Tableau 9 



Proteine presentant une similitude 
significative 


Numero d'acces 
GenBank 


Score 
BLAST* 


Fonction 
rapportee 


AcrW (Streptomyces galilaeus) 


BAB72060 


94 


Transporteur 
ABC 


Daunorubicin resistance transmembrane 
proteine (Streptomyces peucetius) 


P32011 


89 


■*. 

Resistance a la 
daunorubicine 


Probable ABC-transporter, 
transmembrane component, 
(Streptomyces coelicolor) 


NP_626506 


89 


Transporteur 
ABC 



* une plus grande similitude de sequence est associee a un score BLAST plus eleve 
(Altschul et al, 1990). 

Le gene or/9* code une proteine presentant une relative forte similitude avec une 
proteine de type transporteur ABC chez Streptomyces griseus (Campelo, 2002, Numero 
d'acces GenBank : CAC2211 8 ; Score BLAST : 269). Cette similitude avec une proteine 
de type transporteur ABC suggere fortement que le gene or/P* code egalement une 
proteine de type transporteur ABC pouvant etre impliquee dans la resistance a la 
spiramycine. Cette hypothese est 6tayee par le fait que la proteine codee par le gene 
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or/8* presente une forte similitude avec d'autres proteines de fonction similaire chez 
d'autres organismes (cf. tableau 10). 

Tableau 10 



Proteine presentant une similitude*significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction 
rapportee 


Probable ABC-type transport protein, ATP- 
binding component (S. coelicolor) 


NP_626505 


231 


Transporteur 
ABC 


Putative ABC transporter ATP-binding 
component (Streptomyces Coelicolor) 


NP_627624 


228 


Transporteur 
ABC 



* une plus grande similitude de sequence est associee a un score BLAST plus <?leve 

v 

(Altschul etaL, 1990). 



Le gene or/70* code une proteine presentant une relative forte similitude avec^une 
proteine de fonction inconnue. Cependant des genes similaires a or/70* sont retrouves 
au milieu de plusieurs groupes de genes impliques dans la biosynthese d'antibiotiques. 
Ainsi un gene proche de or/70* est retrouve chez S. coelicolor (Redenbach et aL 9 1996, 
numero d'acces GenBank : NP_627432, score BLAST : 109). Un gene proche {CoiiY) 
est egalement retrouve chez S. rishiriensis (Wang et al. y 2000 5 numero d'acces 
GenBank : AAG29779, score BLAST 97). 

Genes situes en amont des g&ies cod ant les PKS 

Dans la sequence d'ADN situee en amont des genes codant les PKS (Paval et 
l'amont etant defini par Porientation des 5 genes de PKS tons orientes dans le meme 
sens) (cf. figure 3), 32 ORFs ont ete identifies (cf. ci-dessus). Ainsi, les 32 phases 
ouvertes de lecture de ce type, occupent une region d' environ 40 kb (cf. SEQ ID N° 1 
presentant une premiere region de 31 kb contenant 25 ORFs et SEQ ID N° 106 
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pr6sentant une region d'envixon 10,3 kb dont 1402 pb chevauchent la sequence 
precedente (SEQ ID N° 1) et environ 9 kb correspondent a la suite de la sequence (avec 
ccpendant un region d' environ 450 nucleotides dont la sequence n'a pas etc determinee 
(region symbolisee par des «N » dans ladite sequence)), cette derniere partie de 9 kb 
contient 7 ORFs supplemental (dont une ORF de sequence partielle, due a la 
sequence indeterminee (orf28c)\ cf. egalement figure 3 et 37 et ci-dessous). Une 
representation schematique de l'organisation de la region est presentee en figure 5 et 37. 
Les 32 genes identifies ont ete nommes : orfl, orfl, or/3, orf4, orf5, orf6, or/7, or/8, 
orpc, or/10, orfllc, orfl 2, orfl 3c, orfl 4, orfl 5c, orfl 6, orfl 7, or/18, or/19, or/20, 
orfllc, or/22c, or/23c, or/24c, or/25c, or/26, or/27, or/28c, or/29, or/30c, or/31 et 
or/32c. 

Dans le tableau 1 1 suivant sont presentees les references a la sequence en ADN et 
en acides amines des 32 genes identifies en amont des 5 genes PKS. 



Tableau 11 



Gene' 


Position dans la 
sequence SEQ ID N 1 


Sequence ADN 


Sequence(s) polypeptidique(s) 2 


orfl 


658 a 1869 


SEQ ID N 23 


SEQ ID N 24 


or/2 


1866 a 2405 


SEQ ID N 25 


SEQ ID N 26 et 27 


or/3 


2402 a 3568 


SEQ ID N 28 


SEQ ID N 29 .:: 


or/4 


3565 a 4473 


SEQ ID N 30 


SEQ ID N 31, 32 et 33 


or/5 


4457 a 5494 


SEQ ID N 34 


SEQ ID N 35 


or/6 


5491 a 6294 


SEQ ID N 36 


SEQ ID N 37, 38 et 39 ; 


orfl 


6296 a 7705 


SEQ ID N 40 


SEQ ID N 41 et42 


or/8 


8011 a 9258 


SEQ ID N 43 


SEQ ID N 44 


or/9c 


10081 a 9362 


SEQ ID N 45 


SEQ ID N 46 
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orflO 


10656 a 12623 


SEQIDN 47 


SEQ ID N 48 


orfllc 


14482 a 12734 


SEQIDN 49 


SEQIDN 50,51 et 52 


orfl2 


14601 a 16031 


SEQIDN 53 


SEQ ID N 54, 55, 56, 57, 58 et 59 


orfl3c 


17489 a 16092 


SEQIDN 60 


SEQIDN 61 


orfl4 


17809 a 18852 


SEQIDN 62 


SEQIDN 63 


orf!5c 


20001 a 18961 


SEQIDN 64 


SEQIDN 65 


or/16 


20314 a 21552 


SEQIDN 66 


SEQ ID N 67 ;'. ' ■ ! 


or/17 


21609 a 22879 


SEQ ID N 68 


SEQIDN 69 


or/18 


22997 a 24175 


SEQIDN 70 


SEQIDN 71 


or/19 


24177 a 25169 


SEQIDN 72 


SEQIDN 73 


or/20 


25166 a 261 73 


SEQIDN 74 


SEQ ID N 75 


orfllc 


27448 a 26216 


SEQIDN 76 


SEQ ID N 77 


or/22c 


28560 a 27445 ' 


SEQIDN 78 


SEQIDN 79 


or/23c 


29770 a 28649 


SEQIDN 80 


SEQIDN 81 


or/24c 


30074 a 29763 


SEQIDN 82 


SEQIDN 83 . ; ,; 


or/25c 


30937 a 30071 


SEQIDN 84 


SEQIDN 85 


Gene 1 


Position dans la 
senuence SEO ID NO : 
106 


Sequence ADN 


Sequence(s) polypeptidique(s) 2 


or/26 


1647 a 2864 


SEQIDN 107 


SEQIDN 108 


or/27 


2914 a 3534 


SEQIDN 109 


SEQIDN 110 


or/28c 


debute a la position 4973 


SEQIDN 111 


SEQIDN 112 


or/29 


5662 a 6669 


SEQIDN 113 


SEQIDN 114 


orfiOc 


7729 a 6692 


SEQIDN 115 


SEQIDN 116 et 117 


or/31 


7760 a 8734 


SEQIDN 118 


SEQIDN 119 
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orfilc 


10209 a 8983 


SEQIDN 120 


SEQIDN 121 



1 Le « c » ajoute dans le nom du gene indique que la sequence codante est dans 
l'orientation inverse (le brin codant est done le brin eomplementaire. de la sequence 
donnee en SEQ ID N° 1 ou SEQ ED N° 106 pour ces genes). 

2 Lorsque plusieurs sequences proteiques sont indiquees pour une seule orf, les 
5 proteines correspondantes sont issues de plusieurs sites possibles de demarrage de la 

traduction. 

Dans le but de determiner la fonction des polypeptides identifies dans le tableau 1 1 
ci-dessus, trois types d'experiences ont ete menees : la comparaison de l'identite des 
sequences identifiees avec des sequences de fonctions connues, des experiences 
10 deactivation de genes et des analyses de la production en spiramycines de ces souches 
mutantes. 

Les sequences proteiques deduites de ces phases ouvertes de lecture ont tout 
d'abord ete comparees avec celles presentes dans differentes bases de donnees grace a 
differents programmes: BLAST (Altschul et al., 1990) (Altschul et al, 1997), CD- 

15 search, COGs (Cluster of Orthologous Groups), FASTA ((Pearson W. R & D. L 
Lipman, 1988) et (Pearson W. R., 1990), BEAUTY (Worley K. C. et al, 1995)), (cf. ci- 
dessus). Ces comparisons ont permis de formuler des hypotheses sur la fonction des 
produits de ces genes et d'identifier ceux susceptibles d'etre impliques dans la 
biosynthese de spiramycine. Le tableau 12 montre les proteines presentant une forte 

20 similitude avec les 32 genes situes en amont des 5 genes PKS. 

Tableau 12 



Gene 


Proteine presentant line similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction 
rapportee 


orfl 


Cytochrome P450 tyll {Streptomyces 
fradiae) 


S49051 


530 


Cytochrome 
P450 
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orfl 


ORF15x4 {Listonella anguillarum) 


AAB81630 


113 


Inconnue 


orfi 


aminotransferase-like protein 
{Streptomyces antibioticus) 


AAF59939 


431 


Amino- 
transferase 


orf4 


alpha-D-glucose- 1 -phosphate 

fh vmi H v1 vl Iran ^fpra^ie ( Strentomvces 

LJU._yliJ.lvlY 1 V J.UI CU.IoXV-'A Clow ykJt-f is-jst-ist * %>jr 

venezuelae) 


AAC68682 


404 


alpha-D-glucose- 
1 -phosphate 
thymidylyltransfe 
rase 


orf5 


AprE {Streptomyces tenebrarius) 


AAG18457 


476 


dTDP-glucose 
4,6-deshydratase 


orf6 


Thioesterase {Streptomyces avermitilis) 


BAB69315 


234 


Thioesterase 


or/7 


TylCVI {Streptomyces fradiae) 


AAF29379 


461 


dNTP hexose 
2,3-deshydratase 


orf8 


probable aminotransferase 
{Saccharopolyspora spinosa) 


AAG23279 


465 


Aminoixansferase 


orf9c 


SrmX {Streptomyces ambofaciens) 


S25204 


445 


Methyltransferase 


nrflO 
OrjlU 


k31llJLTv 1 Ot/ tsLslisfr tyLt/j umt/oy uoto/w y 


S25203 


1074 


Proteine de 
regulation 


orfllc 


SrmB {Streptomyces ambofaciens) 


S25202 


955 


Resistance a la 
spiramycine 


orfl2 


UrdQ {Streptomyces fradiae) 


AAF72550 


634 


NDP-hexose 3,4- 
deshydratase 


orfl3c 


SC4H2.17 {Streptomyces coelicolor) 


T35116 


619 


Inconnue 


or/24 


putative reductase {Streptomyces 
coelicolor) 


CAB90862 


147 


Reductase 


orflSc 


Probable 3-ketoreductase {Streptomyces 
antibioticus) 


T51102 


285 


3-cetoreductase 


orf!6 


Hypothetical NDP hexose 3,4 
isomerase {Streptomyces fradiae) 


CAA57471 


209 


NDP hexose 3,4 
isomerase 


orf!7 


Glycosyl transferase {Streptomyces 
venezuelae) 


AAC68677 


400 


Glycosyl 
transferase 
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orflS 


Cjiycosyi transierase {oireptumyt,^ 
rishiriensis) 


AAG29785 


185 


Glycosyl 
transferase 


or/19 


NUJr-iiexose 4-ceioreauciase i yiwi_Y. 
{Streptomyces fradiae) 


AAD41822 


266 


NDP-hexose 4- 
cetoreductase 


orf20 


EryBII {Saccharopolyspora erythrdea) 


AAB84068 


491 


aldoceto 
reductase 


or/21c 


TylCIII {Streptomyces fradiae) 


AAD41823 


669 


NDP-hexose 3-C- 
methyltransferase 


or/22c 


FkbH {Streptomyces hygroscopicus) 


AAF86387 


463 


Implique dans la 
biosynthese du 
methoxymalohyl 


or/23c 


Fkbl {Streptomyces hygroscopicus) 


AAF86388 


387 


Acyl CoA 
dehydrogenase 


or/24c 


FkbJ {Streptomyces hygi'oscopicus) 


AAF86389 


87 


Implique dans la 
biosynthese du 
methoxymalonyl 


or/25c 


FkbK {Streptomyces hygroscopicus) 






Acvl CoA 
dehydrogenase 


or/26 


TylCV {Streptomyces fradiae) 




4.71 


ivx y wcii. w k> y a 

transferase 


or/27 


TylCVII {Streptomyces fradiae) 


A/VLJ41 o/J 




NDP-hexose 3 5- 
(ou 5-) epimerase 


or/28c 


AcyB2 {Streptomyces thermotolerans) 


JC2032 


329 


proteine 
regulatrice 


or/29 


Beta-manannase {Sorangium 
cellulosum) 


AAK19890 


139 


Glycosyl 
hydrolase 


or/SOc 


Epimerase de sucre-nucleoside- 
diphosphate {Corynebacterium 
glutamicum) 


NP_60059( 


) 89 


Epimerase de 

sucre-nucleoside- 

diphosphate 
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or/31 


Oxidoreductase (Streptomyces 
coelicolor) 


NP_631148 


261 


Oxidoreductase 


orf32c 


Proteine regulatrice de la famille GntR 

{Streptomyces coelicolor) 


NP_625576 


229 


Proteine 
regulatrice 



* une plus grande similitude de sequence est associee a un score BLAST plus 



eleve (Altschul et ah, 1990). 

Des experiences deactivation de genes ont ete realisees pour confirmer ces 
5 resultats. Les methodes utilisees consistent a effectuer un remplacement de gene. Le 
gene cible a interrompre est remplace par une copie de ce gene interrompue par urie 
cassette conferant la resistance a un antibiotique (par exemple Tapramycine oil 
Phygromycine). Les cassettes utilisees sont bordees de part et d'autre par des codons de 
terminaison de la traduction dans toutes les phases de lecture et par des terminateurs de 
10 transcription actifs chez Streptomyces. L'insertion de la cassette dans le gene cible petit s 
s'accompagner ou non d'une deletion dans ce gene cible. La taille des regions flanqu&nt 
la cassette peut aller de quelques centaines a plusieurs milliers de paires de bases. Un : 
deuxieme type de cassettes peut etre utilise pour Tinactivation de genes : des cassettes 
dites « cassettes excisables » (cf. ci dessus). Les souches ainsi construites ont ete testees 
15 pour leur production en spiramycines. 

Le gene orfl code une proteine presentant une relative forte similitude avec 
plusieurs cytochrome P450. Notamment, la proteine codee par orfl possede line 
similitude importante avec la proteine codee par le gene tyll impliquee dans la ' 
biosynthese de tylosine chez Streptomyces fradiae (Merson-Davies,L-A. et al, 1994 ; ■ 
20 Numero d'acces GenBank : S49051 ; Score BLAST : 530). Cette similitude avec une . 
proteine impliquee dans la voie de biosynthese d'un autre antibiotique proche suggere 
fortement que le gene orfl code egalement une cytochrome P450. Cette hypothese est 
etayee par le fait que la proteine codee par le gene orfl presente une forte similitude 
avec d'autres proteines de fonction similaire chez d'autres organismes (cf. tableau 13). 
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Tableau 13 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


Putative cytochrome P450 YJD3 
(Bacillus subtilis) 


034374 


248 


Cytochrome P450 


Cytochrome P450 1 13 Al 
(Saccharopolyspora erythraea) 


P48635 


237 


Cytochrome P450 


Cytochrome P-450 hydroxylase 
homolog (Streptomyces caelestis) 


AAC46023 


208 


Cytochrome P-450 
hydroxylase 


Cytochrome P450 monooxygenase 
(Streptomyces venezuelae) 


AAC64105 


206 


Cytochrome P450 
monooxygenase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al, 1990). 



Le gene or/2 code une proteine presentant une similitude avec plusieurs proteines 
de fonctions inconnues (cf. Tableau 14). Notamment, la proteine codee par or/2 possede 
une similitude relativement importante avec la proteine codee par le gene ORF15x4 de 
Listonella anguillarum (numero d'acces GenBank : AAB81630 ; Score BLAST : 113) 
de fonction inconnue. 



Tableau 14 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


unknown (Campylobacter jejuni) 


AAK12959 


106 


Inconnue 
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WcgF {Bacteroides fragilis) 


AAD56738 


105 


Inconnue 


unknown {Leptospira borgpetersenii) 


AAD 12964 


96 


Inconnue 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al, 1 990). 



Le gene orf2 n'ayant pas d'homologue de fonction connue, son inactivation a ete 
realisee. Dapu etre montre que la souche resultante ne produit plus de spiramycines. 
5 Ceci confirme que le gene or/2 est bien implique dans la biosynthese des spiramycines. 
La proteine codee par ce gene regule ou est responsable d'une etape de bioconversion ■ 
essentielle a la biosynthese des spiramycines. 

Le gene or/5 code une proteine presentant une relative forte similitude avec 
plusieurs aminotransferases. Notainment, la proteine codee par orf3 possede une 

10 similitude importante avec une aminotransferase de Streptomyces antibioticus impliquee 
dans la biosynthese de 1' oleandomycin (Draeger,G., et al, 1999; Numero d>cces 
GenBank: AAF59939 ; Score BLAST: 431). Cette similitude avec une proteine ; 
impliquee dans la voie de biosynthese d'un autre antibiotique proche suggere fortement 
que le gene or/3 code une 3 amino-transferase responsable de la reaction de 

15 transamination necessaire a la biosynthese d'un des sucres amines des spiramycines (cf. 
figure 5). Cette hypothese est etayee par le fait que la proteine codee par le gene orfi 
presente une forte similitude avec d'autres proteines de fonction similaire chez d'autres 
organismes (cf. tableau 15). 



Tableau 15 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


Aminotransferase (Streptomyces 
antibioticus) 


T51111 


429 


Aminotransferase 
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Transaminase {Streptomyces 


AAC68680 


419 


Transaminase 


venezuelae) 









* une plus grande similitude de sequence est associee a un score BLAST plus 



eleve (Altschul et al., 1990). 

L'inactivation du gene or/3 a ete realisee. II a ainsi pu etre montre que la souche 
resultante ne produit plus de spiramycines. Ceci confirme que le gene or/3 est bien 

5 implique dans la biosynthese des spiramycines. L'enzyme codee par ce gene est done 
bien responsable d'une etape de bioconversion essentielle a la biosynthese des 
spiramycines. La production de spiramycines peut etre complementer par 1' expression 
de la proteine TylB de S, fradiae (cf exemple 23). Ceci demontre que le gene oij3 code 
une 3 amino-transferase responsable de la reaction de transamination necessaire a la 

10 biosynthese du mycaminose (cf. figure 5). Comme le mycaminose est le premier sucre a 
etre fixe sur le platenolide, il est attendu que la souche interrompue dans or/3 (OS49.67) 
accumule du platenolide. 

Les intermedaires de biosynthese de la souche interrompue dans le gene or/3 ont 
ete etudies (cf. exemple 20). Ces experiences ont permis de demontrer que cette souche 
15 produit deux formes de platenolide : le platenolide A et le platenolide B ? la structure 
deduite de ces deux molecules est presentee en figure 36. 

Le gene orf4 code une proteine presentant une relative forte similitude avec; 
plusiexifs NDP-glucose synthetases. Notamment, la pfofeine codee par brf4 possede tine 
similitude importante avec une alpha-D-glucose-1 -phosphate thymidylyl transferase de 

20 Streptomyces venezuelae (Xue Y et al, 1998 ; Numero d'acces GenBank : AAC68682 ; 
Score BLAST 404). Cette similitude avec une proteine impliquee dans la voie de 
biosynthese d'nn autre antibiotique proche suggere fortement que le gene orf4 code une 
NDP-glucose syntethase responsable de la synthese du NDP-glucose necessaire a la 
biosynthese des trois sucres atypiques incorpores dans la molecule de spiramycine (cf. 

25 figure 4, 5 et 6). Cette hypothese est etayee par le fait que la proteine codee par le gene 
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orf4 presente une forte similitude avec d'autres proteines de fonction similaire chez 
d'autres organism es (cf. tableau 16). 

Tableau 16 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


Glucose- 1 -phosphate 
thymidyltransferase (Streptomyces 
avermitilis) 


BAA84594 


402 


Glucose- 1 -phosphate 
thymidyltransferase 


AclY (Streptomyces galilaeus) 


BAB72036 


400 


dTDP-1 -glucose 
synthetase 


Putative glucose- 1 -phosphate 
thymidyltransferase 
(Saccharopolyspora spinosd) 


AAK83289 


399 


glucose- 1 -phosphate 
thymidyltransferase 



* une plus grande similitude de sequence est associee a un score BLAST plus . 



5 eleve (Altschul et al. 9 1990). 

Le gene orf5 code une proteine presentant une relative forte similitude avec . 
plusieurs glucose deshydratases. Notamment, la proteine codee par orf5 possede une; 
similitude importante avec une dTDP-glucose 4,6-deshydratase de Streptomyces 
tenebrarius (Li,T.B. et a/., 2001 ; Numero d'acces GenBank: AAG18457, Score 

10 BLAST : 476). Cette similitude avec une proteine impliquee dans la voie de biosynthese : 
d'un autre antibiotique proche suggere fortement que le gene or/5 code une NDP 
glucose dehydratase necessaixe a la biosynthese des trois sucres atypiques incorpores 
dans la molecule de spiramycine (cf. figure 4, 5 et 6). Cette hypothese est etayee par le 
fait que la proteine codee par le gene or/5 presente une forte similitude avec d'autres 

15 proteines de fonction similaire chez d'autres organismes (cf. tableau 17). 
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Tableau 17 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


DTDP -glucose 4 5 6-deshydratase 
{Saccharopolyspora spinosd) 


AAK83290 


464 


DTDP-glucose 4,6- 
deshydratase 


thymidine diphosphoglucose 4 ? 6- 
deshydratase {Saccharopolyspora 
erythraea) 


AAA68211 


445 


thymidine 

diphosphoglucose 

4,6-deshydratase 


dTDPglucose 4,6-deshydratase (EC 
4.2.1 .46) - {Streptomyces fradiae) 


S49054 


443 


dTDPglucose 4,6- 
deshydratase 


TDP-glucose-4,6-deshydratase 
{Streptomyces venezuelae) 


AAC68681 


421 


TDP-glucose-4,6- 
deshydratase 


SgcA {Streptomyces globisporus) 


AAF13998 


418 


dNDP-glucose-4,6- 
deshydratase 



* une plus grande similitude de sequence est associee a un score BLAST plus 



eleve (Altscfcul et aL, 1 990). 

Le gene orf6 code une proteine presentant une relative forte similitude avec 
plusieurs thioesterases. Notamment, la protdine codee par or/6 possede une similitude 
importante avec une thioesterase de Streptomyces avermitilis (Omura,S. et al., 2001 ; 
Numero d'acces GenBank : BAB69315 ; Score BLAST : 234). Cette similitude avec une 
proteine impliquee dans la voie de biosynthese d'un autre antibiotique proche suggere 
fortement que le gene or/6 code egalement une thioesterase. Cette hypothese est etayee 
par le fait que la proteine codec par le gene orf6 presente une forte similitude avec 
d'autres proteines de fonction similaire chez d'autres organismes (cf. tableau 18). 
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Tableau 18 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

OenBank 


Score 
BLAST* 


Fonction rappoftee 


RifR {Arnycolatopsis mediterranei) 


AAG52991 


216 


Thioesterase 


Thioesterase - (Streptomyces fradiae) 


S49055 


215 


Thioesterase 


Thioesterase (Streptomyces 
avermitilis) 


BAB69188 


213 


l nioesterase 


Thioesterase II (EC 3.1 .2.-) - 
{Streptomyces venezuelae) 


Tl 741.3 


203 


Thioesterase 


PimI protein (Streptomyces natalensis) 


CAC20922 


201 


Thioesterase r- 


Thioesterase (Streptomyces griseus) 


CAC22116 


200 


Thioesterase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et aL 9 1990). 



Le gene or/7 code une proteine presentant une relative forte similitude avec 
5 plusieurs hexose dehydratases. Notamment, la proteine codee par orfS possede une 
similitude importante avec une dNTP hexose 2,3 -dehydratase (codee par le gene 
TylCVI) de Streptomyces fradiae impliquee dans la biosynthese de la tylosine (Merson- 
Davies,L.A. etal, 1994 ; Numero d'acces GenBank : AAF29379 ; Score BLAST : 461). 
Cette similitude avec une proteine impliquee dans la voie de biosynthese d'un autre 1 
10 antibiotique proche suggere fortement que le gene or/7 code egalement une hexose 2-3 
dehydratase necessaire a la biosynthese de deux sucres atypiques incorpores dans la 
molecule de spiramycin e (cf. figure 4 et 6). Cette hypothese est etayee par le fait que la 
proteine codee par le gene or/7 presente une forte similitude avec d'autres proteines de 
fonction similaire chez d'autres organismes (cf. tableau 19). 
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Tableau 19 



Proteine presentant une similitude 
significative 


Numero 

-d'aeces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


Rifl 8 {Amycolatopsis mediterranei) 


AAG52988 


459 


Hexose dehydratase 


SimB3 {Streptomyces antibioticus) 


AAK0681O 


444 


dNDP-4-keto-6-deoxy- 
glucose-2,3-deshydratase 



* une plus grande similitude de sequence est associee a un score BLAST plus 



eleve (Altschul et aL, 1990). 

Le gene orfS code une proteine presentant une relative forte similitude avec 
5 plusieurs aminotransferases. Notamment, la proteine codec par or/8 possede une 
similitude importante avec une aminotransferase probablement impliquee dans la 
biosynthese de la forosamine chez Saccharopolyspora spinosa (Waldron,C. et al, 2001 ; 
Numero d'acces GenBank : AAG23279 ; score BLAST : 465). Cette similitude avec une 
proteine impliquee dans la voie de biosynthese d'un autre antibiotique proche suggere 
10 fortement que le gene or/8 code une 4 amino-transferase responsable de la reaction de : 
transamination necessaire a la biosynthese de la forosamine (cf. figure 6). Cette 
hypothese est etayee par le fait que la proteine codee par le gene orf8 presente une forte 
similitude avec d'autres proteines de fonction similaire chez d'autres organismes (cf. 
tableau 20). 

15 



/ 
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Tableau 20 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


Putative amino-sugar biosynthesis 
protein (Bordetella bronchiseptica) 


CAA07666 


213 


Proteine impliquee dans la 
biosynthese d'amino-sucre 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et aL 9 1990). 



L'inactivation du gene or/8 a ete realisee. II a pu ainsi etre montre que la souche 
5 resultante ne produit plus de spiramycines. Ceci confirxne que le gene or/8 est bien 
implique dans la biosynthese des spiramycines. L 5 enzyme codee par ce gene est done 
* bien responsable d'une etape de bioconversion essentielle a la biosynthese des 
spiramycines. 

Le gene orj9c a deja ete identifie chez Streptomyces ambofaciens et a ete designe 
10 srmX par Geistlich et al (Geistlich ? lVL, et aL, 1992). La similitude de la proteine codee 
par ce gene avec plusieurs methyltransferases impliquees dans la voie de biosynthese 
d'autres antibiotiques proches suggere fortement que le gene or9c code une methyl- 
transferase responsable de la reaction de methylation necessaire a la biosynthese du 
mycaminose ou de la forosamine (cf. figure 5 et 6). Cette hypothese est etayee par le fait 
15 que la proteine codee par le gene orf9e presente une forte similitude avec d'autres 
proteines de fonction similaire chez d'autres organismes (cf. tableau 21). 



Tableau 21 



Proteine presentant uiie similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


N ? N-dimethyltransferase 
{Streptomyces venezuelae) 


AAC68678 


240 


N,N- 

dimethyltransferase 
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Methyltransferase {Streptomyces 
antibioticus) 


CAA05643 


232 


Methyltransferase 


Putative amino methylase , 
{Streptomyces nogalater) 


AAF01819 


219 ' 


' Aminbmethylase 



* line plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al, 1990). 



Le gene or/10 a deja ete identifie chez Streptomyces ambofaciens et a ete designe 
srmR par Geistlich et al (Geistlich,M. ? et al, 1992). La proteine codee par ce gene est 
5 impliquee dans la regulation de la voie de biosynthese des spiramycines chez 
Streptomyces ambofaciens. L'inactivation du gene orflO a ete realisee. H a pu ainsi etre 
montre que la souche resultante ne produit plus de spiramycines. Ceci confirme que le 
gene orflO est bien implique dans la biosynthese des spiramycines. La proteine codee 
par ce gene est done bien essentielle a la biosynthese des spiramycines. 

10 D 5 autre part ; le point de demarrage de la traduction de orflO a ete determine et il 

a pu etre montre que la surexpression de ce gene entraine une amelioration de la 
production en spiramycines. Le site de demarrage de la traduction correspond a un ATG 
situe en amont de V ATG propose par Geistlich et al (Geistlich,M., et al, 1992). II a en 
outre ete demontre que cette extremite 5 5 est esentielle a la fonction de OrflO puisqu'un 

15 messager tronque en 5' est inactif (cf. exemple 17). Pour obtenir Feffet recherche sur la 
production en spiramycines, il est done essentiel que la surexpression de orflO soit 
realisee en prenant garde de ne pas exprimer un messager tronque en 5' de orflO. 

Le gene orfllc a deja ete identifie chez Streptomyces ambofaciens et a ete designe 
srmB par Geistlich et al (Geistlich,M. et al, 1992) et Schoner et al (Schoner B et al, 
20 1992). La proteine codee par ce gene est impliquee dans la resistance a la spiramycine 
chez Streptomyces ambofaciens et est un transporteur de type ABC. 
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Le gene or/72 code une proteine presentant une relative forte similitude avec 
plusieurs hexose dehydratases. Notamment, la proteine codee par orfll possede une 
similitude importante avec une NDP-hexose 3,4-deshydratase codee par le gene UrdQ 
de Streptomyces fradiae et impliquee dans la biosynthese de la tylosine (Hoffmeister,D. 
5 et al, 2000 ; Numero d'acces GenBank : AAF72550 ; Score BLAST : 634). Cette 
similitude avec une proteine impliquee dans la voie de biosynthese d'un autre 
antibiotique proche suggere fortement que le gene orfll code une 3,4 dehydratase 
responsable de la reaction de deshydratation necessaire a la biosynthese de la forosamine 
(cf. figure 6). Cette hypothese est etayee par le fait que la proteine codee par le gene 
10 orfl2 presente une forte similitude avec d'autres proteines de fonction similaire chez 
d'autres organismes (cf tableau 22). 



Tableau 22 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


AknP {Streptomyces galilaeus) 


AAF73452 


625 


3-deshydratase 


NDP-hexose 3 ? 4-dehydratase homolog 
{Streptomyces cyanogenus) 


AAD13547 


624 


NDP-hexose 3,4- 
deshydratase 


Rdml {Streptomyces purpuras cens) 


AAL24451 


608 


hexose-C-3- 
deshydratase 


Probable CDP-4-keto-6-deoxyglucdse- 
3 -dehydratase (El) {Streptomyces 
violaceomber) 


T46528 


602 . 


CDP-4-ceto-6- 

deoxyglucose-3- 

deshydratase 


Probable NDP-hexose-3,4-dehydratase 
{Saccharopolyspora spinosa) 


AAG23278 


582 


NDP-hexose-3,4- 
deshydratase 



1er depot 



54 



10 



dNTP-bexose dehydratase 


/JKJ 




dNTP-hexose 


{Amycolatopsis mediterranei) 






dehydratase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al, 1990). 

L'inactivation du gene or/12 a ete realisee. II a pu etre montre que la souche 
resultante ne produit plus de spiramycines. Ceci confirme que le gene orfl2 est bieh 
implique dans la biosynthese de la spiramycine. L'enzyme codee par ce gene est done 
bien responsable d'une etape de bioconversion essentielle a la biosynthese de la 
spiramycine. 

Le gene orfl3c code une proteine presentant une relative forte similitude avec une 
proteine de fonction inconnue chez Streptomyces coelicolor. Cette proteine a ete 
nonimee SC4H2.17 (numero d'acces GeneBank : T35116; Score BLAST: 619). La 
proteine codee par le gene orfl3c presente egalement une forte similitude avec d'autres 
proteines d'autres organismes (cf. tableau 23). 



Tableau 23 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


hflX protein {Mycobacterium leprae) 


S72938 


473 


Inconnue 


Possible ATP/GTP-binding protein 
{Mycobacterium leprae) 


NP„301739 


470 


Proteine fixant 
1 ? ATP/GTP 


GTP -binding protein {Mycobacterium 
tuberculosis CDC1551) 


AAK47114 


468 


Proteine fixant le 
GTP 
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ATP/GTP-bindkig protein 


T44592 


388 


Proteine fixant 


{Streptomyces fradiae) 






]'ATP/GTP 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al. 9 1990). 



Aucune fonction precise n'a ete assignee aux proteines proches de celle codee 
5 par orfl3c. L'inactivation du gene orfl3c a ete realisee dans le but d'etudier la fonction 
de ce gene dans la voie de biosynthese des spiramycines chez Streptomyces 
ambofaciens. II a pu etre montre que la souche resultante produit des spiramycines. Ceci 
indique que le gene orfl3c n'est pas essentiel a la biosynthese des spiramycines et qu'il 
n'est pas essentiel a la survie de la bacterie. L' enzyme codee par ce gene n'est done pas 
10 responsable d'une etape de bioconversion essentielle a la biosynthese des spiramycines. 

Le gene orfl4 code une proteine presentant une relative forte similitude avec une 
reductase putative (Redenbach,M. 5 et al, 1996 ; Bentley et al y 2002 ; numero d'acpes 
GenBank : GAB90862 ; Score BLAST : 147). 

L'inactivation du gene orfl4 a ete realisee. II a pu ainsi etre montre que la souche 
15 resultante ne produit plus de spiramycines. Ceci confirme que le gene orfl4 est bien 
implique dans la biosynthese des spiramycines. L' enzyme codee par ce gene est done . 
bien responsable d' une etape de bioconversion essentielle a la biosynthese dies 
spiramycines. Les intermedaires de biosynthese de la souche interrompue dans le gefie 
or/74 ont ete etudies (cf. exemple 20). Ces experiences ont permis de demontrer que 
20 cette souche produit du platenolide A mais ne produit pas de platenolide B (cf. figure 
36). 

Le gene orflSc code une proteine presentant une relative forte similitude avec 
plusieurs cetoreductases. Notamment, la proteine codee par orflSc possede une 
similitude importante avec une 3-cetoreductase chez Streptomyces antibioticus (Numero 
25 d'acces GenBak : T51102, Score BLAST : 285). Cette similitude suggere fortement que 
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le gene orflSc code une 3 ceto-reductase responsable de la reaction de reduction 
necessaire a la biosynthese de la forosamine (cf. jfigure 6). Cette hypothesc est etayee par 
le fait que la proteine codee par le gene orflSc presente une forte similitude avec 
d'autres proteines de fonction similaire chez d'autres organismes (cf. tableau 24). 



Tableau 24 



Proteine presentant une similitude 
significative 


Numero 
d'acces 

VJ Clio diiis. 


Score 
BLAST* 


Fonction rapportee 


oxidoreductase homolog {Streptomyces 
cyanogenus) 


AAD13550 


272 


Oxidoreductase 


D-oliose 4-cetoreductase 
{Streptomyces argillaceus) 


CAB96550 


265 


D-oliose 4- 
cetoreductase 


AknQ {Streptomyces galilaeus) 


AAF73453 


263 


putative 3- 
cetoreductase 


Probable NDP-hexose-3-ketoreductase 
{Saccharopolyspora spinosa) 


AAG23275 


253 


NDP-hexose-3- 
cetoreductase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al, 1990). 



Le gene or/16 code une proteine presentant une relative forte similitude avec 
plusieurs isomerases. Notamment, la proteine codee par orfl6 possede une similitude 

10 importante avec une NDP hexose 3,4 isomerase chez Streptomyces fradiae (Gandecha et 
al., 1997 ; Numero d'acces GenBak : CAA57471, Score BLAST : 209). Cette similitude 
suggere fortement que le gene orfl6 code une NDP hexose 3,4 isomerase responsable de 
la reaction d'isomerisation necessaire a la biosynthese du mycarose (cf. figure 5). Cette 
hypothese est etayee par le fait que la proteine codee par le gene orfl6 presente une forte 

15 similitude avec d'autres proteines de fonction similaire chez d'autres organismes (cf. 
tableau 25). 
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Tableau 25 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Scx>re 
BLAST* 


Fonction rapportee 


Putative tautomerase (Streptomyces 
venezuelae) 


AAC68676 


145 


Tautomerase 


TDP~4~ceto-6-deoxyhexose 3,4- 
isomerase (Micromonospora 
megalomicea subsp. nigra) 


AAG13907 


112 


TDP-4-ceto-6- 
deoxyhexose 3,4- 
isomerase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et ah, 1 990). 



Le gene or/17 code une proteine presentant une relative forte similitude avec 
5 plusieurs glycosyl transferases. Notamment, la proteine codee par orfl 7 possede une 
similitude importante avec une glycosyl transferase de Streptomyces venezuelae (Xue,Y. 
et a/., 1998; Numero d'acces GenBank: AAC68677 ; score BLAST: 400). La 
similitude de la proteine codee par le gene orfl 7 avec plusieurs glycosyl transferases 
impliquees dans la voie de biosynthese d'autres antibiotiques proches suggere fortemerit 
10 que ce gene code egalement une glycosyl transferase. Cette hypothese est etayee par le 
fait que la proteine codee pax le gene orfl 7 presente une forte similitude avec d'autres 
proteines de fonction similaire chez d'autres organismes (cf. tableau 26). 



Tableau 26 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


Glyco syltransferase {Streptomyces 
fradiae) 


CAA57472 


399 


Glycosyltransferase 
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Glycosyltransferase {Streptomyces 
antibioticus) 


CAA05642 


378 


Glycosyltransferase 


Glycosyltransferase (Streptomyces 
antibioticus) 


CAA05641 


360 


Glycosyltransferase 


Glycosyltransferase 
{Saccharopolyspora erythraed) 


CAA74710 


344 


Glycosyltransferase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul etal, 1990). 



Le gene orfl8 code une proteine presentant une relative forte similitude avec 
plusieurs glycosyl transferases. Notamment, la proteine codee par or/18 possede une 
similitude importante avec une glycosyl transferase de Streptomyces rishiriensis (Wang 
et al.,2000; Numero d'acces GenBank: AAG29785 ; score BLAST: 185). La 
similitude de la proteine codee par le gene or/18 avec plusieurs glycosyl transferases 
impliquees dans la voie de biosynthese d'autres antibiotiques proches suggere fortement 
que ce gene code egalement une glycosyl transferase. Cette hypothese est etayee par le 
fait que la proteine codee par le gene or/28 presente une forte similitude avec d'autres" 
proteines de fonction similaire chez d'autres organismes (cf. tableau 27). 



Tableau 27 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


NovM {Streptomyces spheroides) 


AAF67506 


184 


Glycosyltransferase 


probable glycosyl transferase 
{Streptomyces violaceoruber) 


T46519 


169 


Glycosyltransferase 
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Glycosyl transferase homolog 
{Streptomyces cyanogenus) 


AAD13553 


167 


Glycosyltransferase 


Glycosyl transferase homolog 
{Streptomyces cyanogenus) 


AAD13555 


163 


Glycosyltransferase 


dNTP-hexose glycosyl transferase 
{Amycolatopsis mediterranei) 


AAC01731 


160 


Glycosyltransferase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et aL, 1 990). 



Le gene or/79 code une proteine presentant une relative forte similitude avec 

5 plusieurs cetoreductases. Notamment, la proteine codee par orfl 9 possede une similitude 

: % . .- 

importante avec une NDP-hexose 4-cetoreductase (TylCIV) de Streptomyces fradiae 
(Bate et al.,2000 ; Numero d'acces GenBank : AAD41822 ; score BLAST : 266). La 
similitude de la proteine codee par le gene orfl 9 avec cette cetoreductase impliquee dans 
la voie de biosynthese d'un antibiotique proche suggere fortement que ce gene code 
10 egalement une 4-cetoreductase responsable de la reaction de reduction necessaire a la 
biosynthese du mycarose (cf. figure 4). Cette hypothese est etayee par le fait que la 
proteine codee par le gene orfl9 presente une forte similitude avec d'autres proteines de 
fonction similaire chez d'autres organismes (cf. tableau 28). 



Tableau 28 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


NDP-4-ceto-6-deoxyhexose 4- 
cetoreductase {Streptomyces venezuelae) 


AAL14256 


251 


NDP-4-ceto-6- 
deoxyhexose 4- 
cetoreductase 
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EryBIV {Saccharopolyspora eiythraed) 


AAB84071 


249 


oxidoreductase 


TDP-4-ceto-6-deoxyhexose 4- 
cetoreductase {Micromonospora 
megalomicea subsp. Nigra) 


AAG13916 


218 


TDP-4-ceto-6- 
deoxyhexqse 4- 
cetoreductase 


dTDP-4-c&o-6-deoxy-L-hexose 4- 
reductase (Streptomyces avermitilis) 


BAA84595 


212 


dTDP~4-ceto-6- 
deoxy-L-hexose 4- 
r6ductase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al, 1 990). ' 



Le gene orf20 code une proteine presentant une relative forte similitude avec 
plusieurs hexose reductases. Notamment, la proteine codee par or/20 possede une 
5 similitude importante avec le gene EryBH de Saccharopolyspora etythraea qui code une ; 
dTDP-4-ceto-L-6-deoxy-hexose 2,3-reductase (Summers ? R.G. 5 et at, 1997), Numerd 
d'acces GenBank : AAB84068 ; Score BLAST : 491). La similitude de la proteine codee 
par le gene or/20 avec plusieurs hexose reductases impliquees dans la voie de 
biosynthese d'autres antibiotiques proches suggere fortement que ce gene code une 2-3 
10 reductase responsable de la reaction de reduction necessaire a la biosynthese du 
mycarose (cf. figure 4). Cette hypothese est etayee par le fait que la proteine codee par le 
gene orflO presente une forte similitude avec d'autres proteines de fonction similaire 
chez d'autres organismes (c£ tableau 29). 



Tableau 29 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


TylCII {Streptomyces fradiae) 


AAD41821 


464 


NDP-hexose 2,3- 
enoyl reductase 
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TDP-4-ceto-6-deoxyhexose 2,3- 
reductase (Micromonospora 
megalomicea subsp. Nigra) 


AAG13914 


446 


TDP-4-ceto-6- 
deoxyhexose 2,3- 
reductase 


dTDP-4-ceto-6-deoxy-L-hexose 2,3- 
reductase {Streptomyces avermitilis) 


BAA84599 


377 


dTDP-4-ceto-6- 
deoxy-L-hexose 
2 ,3 -reductase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al, 1990). 



Le gene orfllc code une proteine presentant une relative forte similitude aved 
plusieurs hexose methyltransferases. Notamment, la proteine codee par orfllc possede • 

5 une similitude importante avec le gene TylCIII de Streptomyces fradiae qui code une 
NDP-hexose 3-C-methyltransferase (Bate,N et al, 2000 ; Numero d'acces GenBank : 
AAD41823 ; Score BLAST : 669). La similitude de la proteine codee par le gene or/21 c 
avec plusieurs hexose methyltransferases impliquees dans la voie de biosynthese 
d'autres antibiotiques proches suggere fortement que ce gene code une hexose ; ; 

10 methyltransf erase responsable de la reaction de methyl ati on necessaire a la biosynthese 
du mycarose (cf. figure 4). Cette hypothese est etayee par le fait que la proteine codee; 
par le gene orf21c presente une forte similitude avec d'autres proteines de fonctioh 
similaire chez d'autres organismes (cf tableau 30). 



Tableau 30 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


eryH (Saccharopolyspora erythraea) 


228448 


592 


Gene de 
biosynthese de 
1 5 erythr omy cine 
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S-adenosyl-dependent methyl 
transferase {Coxiella burnetii) 


AAK71270 


358 


Methyltransferase 


NovU {Streptomyces spheroides) 


AAF67514 


184 


C~methyltransferase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et ah, 1 990). 



Le gene orf22c code une proteine presentant une relative forte similitude avec la 
proteine codee par le gene fkbH de Streptomyces hygroscopicus var. as corny ceticus qui 
5 code une enzyme impliquee dans la biosynthese du methoxymalonyl (Wu,K. et 
aL f 200Q ; Numero d'acces GenBank : AAF86387 ; Score BLAST : 463). La similitude 
de la proteine codee par le gene orf22c avec cette proteine impliquee dans la voie de 
biosynthese d'un autre macrolide proche suggere fortement que ce gene code egalement 
une enzyme impliquee dans la biosynthese du methoxymalonyl chez Streptomyces 
10 ambofaciens (cf. figure 8). 

Le gene orf23c code une proteine presentant une relative forte similitude avec la 
proteine codee par le gene fkbl de Streptomyces hygroscopicus var. ascomyceticus qui 
code une acyl Co A dehydrogenase impliquee dans la biosynthese du methoxymalonyl 
(Wu,K. et aU 2000 ; Numero d'acces GenBank : AAF86388 ; Score BLAST 387). La 

15 similitude de la proteine codee par le gene orf23c avec plusieurs acyl Co A 
dehydrogenases impliquees dans la voie de biosynthese d'autres antibiotiques proches 
suggere fortement que ce gene code une acyl Co A dehydrogenase impliquee dans' la ; 
biosynthese du methoxymalonyl (cf figure 8). Cette hypothese est etayee par le fait que 
la proteine codee par le gene orf23c presente une forte similitude avec d'autres proteines 

20 de fonction similaire chez d'autres organismes (cf. tableau 31). 
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Tableau 31 



Proteine presentant vine similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


Acyl-CoA dehydrogenase 
(Polyangium cellulosum) 


AAK19892 


171 


Acyl-CoA 
deshydrogenase 


Probable acyl-CoA dehydrogenase - 
{Streptomyces coelicolor) 


T36802 


160 


acyl-CoA 
deshydrogenase 



* une plus grande similitude de sequence est associee a un score BLAST plus 



el eve (Altschul et al., 1 990). 

Le gene orf24c code une proteine presentant une relative forte similitude avec. la 
5 proteine codee par le gene fkbJ de Streptomyces hygroscopicus var. ascomyceticus ^ui 
coderait la proteine de liaison du groupement acyl (Acyl Carrier Protein (ACP)) 
impliquee dans la biosynthese du methoxymalonyl (Wu,K., et al, 2000 ; Numero 
d'acces GenBank : AAF86389 ; Score BLAST : 87). La similitude de la proteine codee 
par le gene orf24c avec cette proteine impliquees dans la voie de biosynthese d'un autre 
10 macrolide proche suggere fortement que ce gene code une proteine impliquee dans la 
biosynthese du methoxymalonyl chez Sfreptomyces ambofaciens (cf. figure 8). 

Le gene orf25c code une proteine presentant une relative forte similitude avec la 
proteine codee par le genefkbK de Streptomyces hygroscopicus var. ascomyceticus qui % 
code une acyl CoA deshydrogenase impliquee dans la biosynthese du methoxymalonyl 

15 (Wu,K, et aU 2000 ; Numero d'acces GenBank : AAF86390 ; score BLAST : 268). La 
similitude de la proteine codee par le gene orf25c avec plusieurs acyl CoA 
dehydrogenases impliquees dans la voie de biosynthese d'autres antibiotiques proches 
suggere fortement que ce gene code une acyl CoA deshydrogenase impliquee dans la \ 
biosynthese du methoxymalonyl (cf. figure 8). Cette hypothese est etayee par le fait que 

20 la proteine codee par le gene orf25c presente une forte similitude avec d'autres proteines 
de fonction similaire chez d'autres organismes (cf. tableau 32). 
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Tableau 32 



Proteine presentant une similitude 
significative .. 


Numero 
d'acces . . , 
GenBank 


Score 
BLAST* 


Fonction rapportee 


Probable 3-Hydroxybutyryl-CoA 
Dehydrogenase {Bacillus subtilis) 


P45856 


177 


3 -Hydroxybutyryl- 
CoA dehydrogenase 


3-hydroxybutyryl-CoA dehydrogenase 
protein {Bacillus thuringiensis serovar 
kurstaki) 


AAL32270 


174 


3 -hydroxybutyryl- 
CoA dehydrogenase 


3-hydroxybutyryl-CoA dehydrogenase 
{Deinococcus radiodurans) 


NP„294792 


167 


3-hydroxybutyryl- . 
CoA dehydrogenase 



* tine plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et ah, 1 990). 



Le gene or/26 code une proteine presentant une identite de 65% (determinee grace ; 
au programme BLAST) avec la proteine codee par le gene tylCV qui code une 
mycarosyl transferase impliquee dans la biosjoithese de tylosine chez Streptornyces 
fradiae (Bate,N. et ai 9 2000 ; Numero d'acces GenBank : AAD41824, Score BLAST : 
471). Plus particulierement, TylCV est une glycosyl-transferase liant la molecule de 
mycarose lors de la synthese de la tylosine. Cette similitude avec une proteine impliquee 
dans la voie de biosynthese d'un autre antibiotique relativement proche et plus 
parti culierement dans le transfert du mycarose, suggere que le gene orf26 code une 
glycosyl transferase. Cette hypothese est etayee par le fait que la proteine codee par le 
gene or/26 presente une forte similitude avec d'autres proteines de fonction similaire 
chez d'autres organismes (cf. tableau 33). 
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Tableau 33 



significative 


TsJiiniero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


Glycosyl transferase (Streptomyces 
avermitilis) 


BAA84592 


218 


Glycosyl transferase 


CalG4 (Micromonospora echinospora) 


AAM70365 


217 


Glycosyl transferase 


CalG2 {Micromonospora echinospora) 


AAM70348 


197 


Glycosyl transferase 



* une plus grande similitude de sequence est associee a un score BLAST plus. 



eleve (Altschul et aL 9 1990). 

Le gene orf27 code une proteine presentant une identite de 70% (determinee grace 
5 au programme BLAST) avec la proteine codee par le gene tylCVJI qui code uneNDf- 
hexose 3,5- (ou 5-) epimerase impliquee dans la biosynthese de tylosine chez 
Streptomyces fradiae (Bate,N. et a/., 2000 ; Numero d'acces GenBank : AAD41825, 
Score BLAST : 243). Plus particulierement, TylCVII est une hexose 3,5- (ou 5-) 
epimerase impliquee dans la biosynthese du mycarose. Cette similitude avec une 
10 proteine impliquee dans la voie de biosynthese d'un autre antibiotique relativement 
proche et plus particulierement dans la biosynthese du mycarose, suggere que le gene 
orf27 code une epimerase. Cette hypothese est etayee par le fait que la prot6ine codee 
par le gene 6ff27 presents une forte similitude avec d'aiitres proteiiies de fonction 
similaire chez d'autres organismes (cf. tableau 34). Une analyse des sequences proches 
15 obtenues grace au programme BLAST suggere fortement que le gene orfll code une 5 
epimerase responsable de la reaction d'epimerisation necessaire a la biosynthese du 
mycarose (cf. figure 4). 
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Tableau 34 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GehBank" 


Score 
BLAST* 


Fonction rapportee 


LanZl {Streptomyces cyanogenus) 


AAJD13558 


172 


NDP-hexose 3,5- 
epimerase 


Epi (Saccharopolyspora spinosa) 


AAK83288 


169 


TDP-4-keto-6- 
deoxyglucose 3,5 
epimerase 


dNTP-hexose 3,5 epimerase 
{Amycolatopsis mediterranei) 


AAC01732 


166 


dNTP-hexose 3,5 
epimerase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al, 1990). 



La sequence &orf28c est partielle, puisque la sequence d'une region d'environ 
5 450 paires de bases n'a pas ete determine (region symbolisee par des «N» dans la 
sequence SEQ ID N° 106). La sequence partielle de cette ORF a neanmoins ete utilisee 
pour P analyse avec les differents programmes informatiques comme explique ci-dessus. 
II a ainsi pu etre determine que le gene orf28c code une proteine presentant une identite 
de 64% sur la sequence determinee (SEQ ID N° 1 12, qui est la sequence partielle de la 
10 proteine Or£28c) (determinee grace au programme BLAST) avec la proteine codee par le 
gene acyB2 qui code une proteine regulatrice impliquee dans la biosynthese de 
carbomycine chez Streptomyces thermotolerans (Arisawa 5 A.> et aL 9 1993 ; Numero 
d'acces GenBank : JC2032, Score BLAST : 329). Cette similitude avec une proteine 
impliquee dans la voie de biosynthese d'un antibiotique relativement proche suggere que 
15 le gene orf28c code une proteine regulatrice impliquee dans la biosynthese des 
spiramycines. Cette hypothese est etayee par le fait que la proteine codee par le gene 
orf28c presente egalement une forte similitude avec la proteine TylR qui est une 
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proteine regulatrice impliquee dans la biosynthese de tylosine chez Streptomyces fradiae 
(Bate,N. etaL, 1999; Numero d'acces GenBank : AAF29380, Score BLAST : 167). 

Le gene orf28c a pu etre amplifie grace a des oligonucleotides situes de part et 
d' autre de la sequence non determinee et sous clone dans un vecteur d 'expression. II a 
5 pu ainsi etre demontre que la surexpression du gene orf28c augmente significativement 
la production en spiramycines de la souche OSC2 (cf. exemple 24). Ceci demontre que 
la surexpression de orf28c conduit a une augmentation de la production en spiramycines 
et confirme son role en tant que regulateur de la voie de biosynthese des spiramycines. 

Le gene or/29 code une proteine presentant une identite de 31% (determinee grace 
10 au programme BLAST) avec une probable glycosyl hydrolase localisee dans le groupe 
de genes implique dans la biosynthese de soraphen A (un antifongique de la classe des 
polyketides) chez Sorangium cellulosum (LigonJ., et aL, 2002 ; Numero d ? acces 
GenBank: AAK19890, Score BLAST: 139). Cette similitude avec une proteine" 
impliquee dans la voie de biosynthese d'une molecule relativement proche suggere que ; \ 
15 le gene orf29 code une proteine ayant une activite glycosyl hydrolase. Cette hypotheses 
est etayee par le fait que la proteine codee par le gene orf29 presente une forte similitude 
avec d'autres proteines de fonction similaire chez d'autres organismes (cf. tableau 35). 
Une analyse de la sequence de la proteine codee par orf29 grace au programme CD- 
search (cf. ci-dessus) suggere egalement que le gene or/29 code une glycosyl hydrolase. 

20 Tableau 35 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


ManA (Caldicellulosiruptor 
saccharolyticus) 


AAC44232 


136 


beta- 1 ? 4-mannanase 
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ManA (Dictyogloirtus thennophiluni) 


AAB82454 


129 


beta-mannanase 



- • - * une plus grande similitude de sequence est associee a un score BLAST plus eleve 

(Altschul^a/., 1990). 

Le gene or/30c code une proteine presentant une identite de 31% (determinee ' ; 
5 grace au programme BLAST) avec une epimerase de sucre-nucleoside-diphosphate chez 
Corynebacterium glutamicum (Numero d'acces GenBank : NP_600590, Score BLAST : 
89). Cette similitude suggere que le gene orf30c code une epimerase. Cette hypothese 
est etayee par le fait qu'une analyse de la sequences grace au programme CD-search (cf. 
ci-dessus) suggere egalement que le gene or/30c code une epimerase. 

10 Le gene orf31 code une proteine presentant une identite de 52% (determinee grace 

au programme BLAST) avec une oxidoreductase chez Streptomyces coelicolor (Numero 
d'acces GenBank : NP„631148, Score BLAST : 261). Cette similitude suggere que le 
gene orfil code une reductase. Cette hypothese est etayee par le fait qu'une analyse de 
la sequences grace au programme CD-search (cf. ci-dessus) suggere egalement que le 

15 gene orfil code une reductase. Cette hypothese est egalement etayee par le fait que la 
proteine codee par le gene orfil presente une forte similitude avec d'autres proteines de 
fonction similaire chez d'autres organismes (cf. tableau 36). 



Tableau 36 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


Putative oxidoreductase {Streptomyces 
griseus) 


BAB79295 


173 


Oxidoreductase 


MocA (Xanthomonas axonopodis) 


NP_640644 


171 


Oxidoreductase 



une plus grande similitude de sequence est associee a un score BLAST plus eleve 



20 (Altschul et al, 1 990). 
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Le gene o?j32c code une proteine presentant une identite de 47% (determinee 
grace an programme BLAST) avec une proteine regulatrice de la famille GntR chez 
Streptomyces coelicolor (Numero d'acces GenBank : NP_625576, Score BLAST : 229). 
Cette similitude suggere que le gene orf32c code un regulateur transcriptionel de la 
5 famille GntR. Cette hypothese est etayee par le fait que la proteine codee par le gene 
orJ32c presente une forte similitude avec d'autres proteines de fonction similaire chez 
d'autres organismes (cf. tableau 37). 



Tableau 37 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


SC5G8.04 (Streptomyces coelicolor) 


NP_628991 


209 


Proteine regulatrice 
de la famille GntR 


transcriptional regulator (Streptomyces 
venezuelae) 


AAF01064 


176 


Regulateur 
transcriptionel "> : 


BH0578 (Bacillus halodurans) 


NP_241444 


172 


Regualteur 

transcriptionl de la 
famille GntR 



* une plus grande similitude de sequence est associee a un score BLAST plus eleve 



10 (Altschul et aL, 1 990). 

La presente invention a egalement pour objet des polynucleotides s'hybridant 
dans des conditions d'hybridation de forte stringence a au moins Tun des 
polynucleotides de sequence SEQ ID N° 3, 5, 7, 9, 11, 13, 1.5, 17, 19, 21, 23, 25, 28, 30, 
34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74 ; 76, 78, 80, 82, 84, 107, 109, 
15 111, 113, 115, 118, et 120, ou Tun de ses variants ou Tune des sequences derivees de 
celles-ci en raison de la degenerescence du code genetique. Preferentiellement, cesdit 
polynucleotides sont isoles a partir d'une bacterie du genre Streptomyces, plus 
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preferentiellement, ces polynucleotides codent des proteines impliquees dans la 
biosynthese d'un macrolide et encore plus preferentiellement, ces polynucleotides 
codent une proteine ayant une activite similaire a la proteine codee par les 
polynucleotides avec lesquels ils s'hybrident. Les conditions d'hybridation de forte 
5 stringence peuvent etre definies comme des conditions d'hybridation defavorisant 
rhybridation de brins d'acides nucleiques non homologues. Des conditions 
d'hybridations de forte stringence peuvent etre par exemple decrites comme des 
conditions d'hybridation dans le tampon decrit par Church & Gilbert (Church & 
Gilbert, 1984) a une temperature comprise entre 55°C et 65°C, de maniere preferee la 

10 temperature d'hyridation est de 55°C, de maniere encore plus preferee la temperatue 
d'hybridation est de 60°C et de maniere tout a fait preferee la temperature d'hybridation 
est de 65 °C, suivi d'un ou plusieurs lavages effectue en tampon 2X SSC a une 
temperature comprise entre 55°C et 65°C 5 de maniere preferee cette temperature est de 
55°C, de maniere encore plus preferee cette temperatue est de 60°C et de maniere tout a 

15 fait preferee cette temperature est de 65°C, suivi d'un ou plusieurs lavages en tampon 
0.5X SSC a une temperature comprise entre 55°C et 65°C, de maniere preferee cette 
temperature est de 55°C, de maniere encore plus preferee cette temperatue est de 60°C 
et de maniere tout a fait preferee cette temperature est de 65°C Les conditions 
d'hybridation ci-dessus decrites peuvent etre adaptees en fonction de la longueur de 

20 l'acide nuclei que dont l'hybridation est recherchee ou du type de marquage choisi, 
selon des techniques connues de rhomme du metier. Les conditions convenables 
d'hybridation peuvent par exemple etre adaptees selon Pouvrage de RAusubel et al^ 
2002. 

L' invention conceme egalement un polynucleotide ayant au moins 70%, de fa9on 
25 plus preferee 80%, de fa<jon plus preferee 85%, de fa?on encore plus preferee 90%, de 
fa$on encore plus preferee 95% et de maniere tout a fait preferee 98% d'identite en 
nucleotides avec un polynucleotide comprenant au moins 10, 12, 15, 18, 20 a 25, 30, 
40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 
750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 
30 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850 ou 1900 nucleotides consecutifs d'un 
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polynucleotide choisi dans le groupe constitue des sequences nucleotidiques SEQ ID N° 
3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 
66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 118, et 120, ou Pun de 
ses variants ou Tune des sequences derivees de celles-ci en raison de la degenerescence 

5 du code genetique, ou un polynucleotide de sequence complementaire. 
Preferentiellement, ces dits polynucleotides sont isoles a partir d'une bacterie du genre 
Sireptomyces, plus preferentiellement, ces polynucleotides codent des proteines 
impliquees dans la biosynthese d'un macrolide et encore plus preferentiellement, ces 
polynucleotides codent des proteines ayant des activites similaires aux proteines codees 

10 par les polynucleotides avec lesquels ils presentent Pidentite. De fa?on tout a fait 
preferee, un polynucleotide selon P invention est choisi dans le groupe constitue des 
sequences nucleotidiques SEQ ID N° 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 
34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, ; lp9, 
1 1 1, 1 13, 1 15, 1 18, et 120, ou un polynucleotide de sequence complementaire. ^ 

15 L'alignement optimal des sequences pour la comparaison peut etre realise- de 

maniere informatique a Paide d'algorithmes connus, par exemple ceux du package 
FASTA (Pearson W. R & D. J. Lipman, 1988) et (Pearson W. R., 1990), accessible 
notamment aupres du centre de ressources TNFOBIOGEN, Evry, France. A titre 
d'illustration, le pourcentage d'identite de sequence pourra etre determine a Taide du 

20 logiciel LFASTA (Chao K.-M. et aL, 1992) ou LALIGN (Huang X. et Miller W., 
1991). Les programmes LFASTA et LALIGN font partie du package FASTA. LALIGN 
f etoufrie les aligheinents locaux optimaux : ce programme est plus rigoureux, mais aussi 
plus lent que LFASTA. 

Un autre aspect de P invention conceme un polypeptide resultant de Texpression : 
25 d'une sequence d'acide nucleique telle que definie ci-dessus. Preferentiellement, les 
polypeptides selon 1 'invention presentent au moins 70%, de fa<?on plus pref6ree 80% 5 d6 
fa?on plus preferee 85%, de fa9on encore plus preferee 90%, de fa^on encore 'plug 
preferee 95% et de maniere tout a fait preferee 98% d'identite en acides amines avec un 
polypeptide comprenant au moins 10, 15, 20, 30 a 40, 50, 60, 70 ? 80, 90,100, 120, 140, 
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160, 180, 200, 220, 240, 260, 280, 300, 320, 340, 360, 380, 400, 420, 440, 460, 480, 
500, 520, 540, 560, 580, 600, 620 ou 640 acides amines consecutifs (Tun polypeptide 

choisi parmi SEQ ID N° 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 27, 29, 31, 32, 33, 35, 

37, 38, 39, 41, 42, 44, 46, 48, 50, 51, 52, 54, 55, 56, 57, 58, 59, 61, 63, 65, 67, 69, 71, 

5 73, 75, 77, 79, 81, 83, 85, 108, 110, 112, 114, 116, 117, 119 et 121, ou Tune de ces 
sequences excepte que tout au long de ladite sequence un ou plusieurs acides amines 
ont ete substitues, inseres ou deletes sans en affecter les proprietes fonctionnelles ou 
Tun des variant de ces sequences. Preferentiellement les polypeptides selon F invention 
sont exprimes a l'etat naturel par une bacterie du genre Streptomyces, plus 

10 preferentiellement, ces polypeptides sont impliquees dans la biosynthese d'un 
macrolide et encore plus preferentiellement, ces polypeptides ont une activite similaire 
a celle du polypeptide avec lequel il partage Fidentite. De fa^on preferee, un 
polypeptide selon F invention est choisi dans le groupe constitue des sequences 
polypeptidiques SEQ ID N° 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 27, 29, 31, 32, 33, 

15 35, 37, 38, 39, 41, 42, 44, 46, 48, 50, 51, 52, 54, 55, 56, 57, 58, 59, 61, 63, 65, 67, 69, 
71, 73, 75, 77, 79, 81, 83, 85, 108, 110, 112, 114, 116, 117, 119 et 121, ou Fune de ces 
sequences excepte que tout au long de ladite sequence un ou plusieurs acides amines 
ont ete substitues, inseres ou deletes sans en affecter les proprietes fonctionnelles ou 
Tun des variant de ces sequences. De fa?on tout a fait preferee, un polypeptide selon 

20 Finvention est choisi dans le groupe constitue des sequences polypeptidiques SEQ ID 
N° 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 27, 29, 31, 32, 33, 35, 37, 38, 39, 41, 42, 
44, 46, 48, 50, 51, 52, 54, 55, 56, 57, 58, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 
83, 85, 108, 110, 112, 114, 116, 117, 119 et 121. 

L'alignement optimal des sequences pour la comparaison peut etre realise de 
25 maniere informatique a l'aide d'algorithmes connus, par exemple ceux du package 
FASTA (Pearson W. R &. D. J. Lipman, 1988) et (Pearson W. R., 1990), accessible 
notamment aupres du centre de ressources INFOBIOGEN, Evry, France. A titre 
d'illustration, le pourcentage d'identite de sequence pourra etre determine a Faide du 
logiciel LFASTA (Chao K.-M. et aL, 1992) ou LALIGN (Huang X. et Miller W., 
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1991), en utilisant les parametres par defaut tel que defini par le centre de ressources 
INFOBIOGEN, Evry, France. Les programmes LFASTA et LALIGN font partie du 
package FASTA. LALIGN retourne les alignernents locaux optimaux : ce programme 
est plus rigoureux, mais aussi plus lent que LFASTA. 

5 Un autre aspect de 1' invention concerne un ADN recombinant comprenant au 

moins un polynucleotide tel que decrit ci-dessus. Preferentiellement; cet ADN 
recombinant est un vecteur. Encore plus preferentiellement, le vecteur est choisi parmi 
les bacteriophages, les plasmides, les phagemides, les vecteurs integratifs, les fosmides, 
les cosmides, les vecteurs navettes, les BAC (Bacterial Artificial Chromosome) ou les 

10 PAC (PI -derived Artificial Chromosome). A titre illustratif on pent citer comme 
bacteriophages le phage lambda et le phage Ml 3. Comme plasmides on peut citer les 
plasmides se repliquant chez E. coli par exemple pBR322 et ses derives, pUC18 et ses : 
- derives, pUC19 et ses derives, pGB2 et ses derives (Churchward G. et al, 1984),, 
pACYC177 (numero d'acces GenBank : X06402) et ses derives, pACYC184 (numerb 

15 d'acces GenBank : X06403) et ses derives. On peut egalement citer les plasmides sp 
repliquant chez Streptomyces comme par exemple pIJlOl et ses derives, pSG5 ef ses' 
derives, SLP1 et ses derives, SCP2* et ses derives (Kieser et al 2000). Comme 
phagemides on peut citer a titre illustratif pBluescript II et ses derives (commercialises 
notamment par la societe Stratagene (LaJolia, Califomie, USA)), pGEM-T et ses 

20 d6rives (commercialise par la societe Promega (Madison, Wisconcin, USA)), AZAPII et 
ses derives (commercialises notamment par la societe Stratagene (LaJolla, Californie, 
USA)). Comme vecteurs integratifs on peut citer a titre illustratif, les vecteurs 
integratifs chez Streptomyces comme par exemple ceux derives de SLP1 (Kieser et al y 
2000), ceux derives de pSAM2 (Kieser et al, 2000), les vecteurs utilisant les systemes ' 

25 d'integration des phages PhiC31 (Kieser et al, 2000) (par exemple pSET152 (Bierman 
et al, 1992)) ou de VWB (Van Mellaert L, et al 1998), ainsi que les vecteurs utilisant 
le systeme d 'integration de IS1 17 (Kieser et al. 2000). Comme fosmides on peut citer a 
titre illustratif le fosmide pFOSl (commercialise par la societe New England Bioloabs 
Inc., Beverly, Massachusetts, USA) et ses derives. Comme cosmides on peut citer a 

30 titre illustratif le cosmide SuperCos et ses derives (commercialises notamment par la 
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societe Stratagene (LaJolla, Califomie, USA)), le cosmide pWED15 (Wahl et al, 1987) 
et ses derives. Comme vecteurs navettes on pent citer a titre iiiustratif les plasmides 
navettes E. coli I Streptomyces comme par exemple pIJ903 et ses derives, la serie des 
plasmides pUWL, pCAO106, pWHM3, pOJ446 et leurs derives (Kieser et al 2000), les 

5 BAC navettes E. coli I Streptomyces comme par exemple ceux decrits dans la demande 
de brevet WO 01/40497. Comme BAC (Bacterial Artificial Chromosome) on peut citer 
a titre illustratif le BAC pBeloBACll (numero d'acces GenBank :U51113). Comme 
PAC (PI -derived Artificial Chromosome) on peut citer a titre illustratif le vecteur 
pCYPAC6 (numero d'acces GenBank : AF133437). De facon tout a fait preferee, un 

1 0 vecteur selon 1 'invention est choisi parmi pOS49. 1 , pOS49. 1 1 , pOSC49. 1 2, pOS49. 1 4, 
pOS49.16, pOS49.28, pOS44.1, pOS44;2, pOS44.4, pSPM5, pSPM7, pOS49.67, 
pOS49.88, pOS49.106, pOS49.120, pOS49.107, pOS49.32, pOS49.43, pOS49.44, 
pOS49.50, pOS49.99, pSPM17, pSPM21, pSPM502, pSPM504, pSPM507, pSPM508, 
pSPM509, pSPMl, pBXLllll, pBXL1112, pBXL1113, pSPM520, pSPM521, 

15 pSPM522, pSPM523, pSPM524, pSPM525, pSPM527, pSPM528, pSPM34, pSPM35, .■ \ 
pSPM36, pSPM37, pSPM38, pSPM39, pSPM40, pSPM41, pSPM42, pSPM43, 
pSPM44, pSPM45, pSPM47, pSPM48, pSPM50, pSPM51, pSPM52, pSPM53, 
pSPM55, pSPM56, pSPM58, pSPM72, pSPM73, pSPM515, pSPM519, pSPM74 et . 
pSPM75. 

20 Un autre aspect de l'invention conceme un systeme d'expression comprenant un 

vecteur d'expression approprie et une cellule hote permettant l'expression d'un ou ; ' 
plusieurs polypeptides tels qUe decrits ci-dessus dans un systeme biologique. Les 
vecteurs d'expression selon l'invention comprennent une sequence d'acide nucleique 
codant un ou plusieurs polypeptides tels que decrits ci-dessus et peuvent etre destines a 

25 l'expression des differents polypeptides selon l'invention dans diverses cellules hotes 
bien connues de rhomine dn metier. A titre d'exemple, on peut citer les systemes 
d'expression procaryote comme les systemes d'expression chez la bacterie E. coli, les 
sytemes d'expression eucaryotes, comme le systeme d'expression baculoviriis 
permettant une expression dans des cellules d'insectes, les sytemes d'expression 

30 permettant une expression dans des cellules de levures, les sytemes d'expression 
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permettant une expression dans des cellules de mammiferes, notamment des cellules 
humaines. Les vecteurs d' expression utilisables dans de tels systemes sont bien connus 
de rhomme du metier, en ce qui concerne les cellules procaryotes, on peut citer a titre 
illustratif les vecteurs d'expression chez E. coli par exemple, de la famille pET 

5 commercialises par la societe Stratagene (LaJolla, Californie, USA), les vecteurs de la 
famille GATEWAY commercialises par la societe Invitrogen (Carlsbad, California 
USA), les vecteurs de la famille pBAD commercialises par la societe Invitrogen 
(Carlsbad, California USA), les vecteurs de la famille pMAL commercialises par la 
societe New England Bioloabs Inc. (Beverly, Massachusetts, USA), les vecteurs 

10 d' expression inductibles par le rhamnose cites dans la publication Wilms B et al. 9 2001 
et leurs derives, on peut egalement citer les vecteurs d' expression chez Streptomyces 
comme par exemple les vecteurs pIJ4123, pIJ6021, pPM927, pANT849, p ANT 850, 
pANT 851, pANT1200, pANT1201, pANT1202 et leurs derives (Kieser et aL, 2000^. 
En ce qui concerne les cellules de levures, on peut citer a titre illustratif le vecteur pESC 

15 commercialise par la societe Stratagene (LaJolla, Californie, USA). En ce qui concerne 
le systeme d' expression -baculo virus permettant une expression dans des cellules 
d'insectes on peut citer a titre illustratif le vecteur BacPAK6 commercialise par la 
societe BD Biosciences Clontech, (Palo Alto, Californie, USA). En ce qui concerne les 
cellules de mammiferes, on peut citer a titre illustratif des vecteurs comprenant le 

20 promoteur des genes precoces du virus CMV (Cytomegalovirus) (par exemple le 
vecteur pCMV et ses derives commercialises par la societe Stratagene (LaJolla, 
Californie, USA), ou le promoteur des genes immediats (SV40 early promoter) du virus 
simien vacuolisant SV40 (par exemple le vecteur pSG5 commercialise par la societe 
Stratagene (LaJolla, Californie, USA). 

25 L'invention est egalement relative a un precede de production d'un polypeptide 

tel que decrit ci-dessus ledit procede comprenant les etapes suivantes: 

a) inserer un acide nucleique codant ledit polypeptide dans un vecteur approprie 

5 
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b) cultiver, dans un milieu de culture approprie, une cellule hote prealablement 
transformed ou transfectee avec le vecteur de Fetape a) ; 

c) fecuperer le milieu de culture conditiorine ou unextfaif cellulaire, par 
exemple par sonication ou par choc osmotique ; 

d) separer et purifier a partir dudit milieu de culture ou encore a partir de 
Fextrait cellulaire obtenu a Fetape c), ledit polypeptide ; 

e) le cas echeant, caracteriser le polypeptide recombinant produit. 

Un polypeptide recombinant selori Pinvention peut etre purifie par passage siir 
une serie appropriee de colonnes de chromatographic, selon les methodes connues de 
Phomme de Fart et decrites par exemple dans F.Ausubel et al (2002). On peut citer a 
titre illustratif la technique du « Tag-Histidine », qui consiste a aj outer une courte 
sequence poly-histidine au polypeptide a produire, ce dernier pouvant ensuite etre 
purifie sur colonne de nickel. Un polypeptide selon Finvention peut etre egalement 
prepare pax les techniques de synthese in vitro. A titre illustratif de telles techniques, un 
polypeptide selon Finvention pourra etre prepare grace au systeme « rapid translation 
system (RTS)» ? commercialise notamment par la societe Roche Diagnostics France 
S.A> Meylan, France. 

Un autre aspect de Finvention concerne des cellules hotes dans laquelle a ete 
introduit au moins un polynucleotide et/ou au moins un ADN recombinant et/ou au 
moins un vecteur d f expression selon Finvention. 

Un autre aspect de Finvention concerne des microorganismes bloques dans une 
etape de la voie de biosynthese d'au moins un macrolide. L'interet reside d f une part 
dans Fetude de la fonction des proteines mutees et d'autre part dans la realisation de 
microorganismes produisant des intermediaires de biosynthese. Ces intermediaires 
peuvent etre modifies, eventuellement apres separation, soit par ajout de composants 
particuliers dans les milieux de production, soit par introduction dans les 
microorganismes ainsi mutes d'autres genes codant des proteines susceptibles de 
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modifier l'intermediaire en s'en servant comme substrat. Ces intermediaires peuvent 
ainsi etre modifies par voie chimique, biochimique, enzymatique et/ou microbiologique. 
Les microorganismes bloques dans une etape de la voie de biosynthese de macrolides 
peuvent etre obtenus en inactivant la fonction d'une on plusieurs proteines impliquees 

5 dans la biosynthese de ce ou de ces macrolides. dans des microorganismes producteurs 
de ce ou de ces macrolide. Selon la ou les proteines inactivees, on pourra ainsi obtenir 
des microorganismes bloques dans les differentes etapes de la voie de biosynthese de ce 
ou de ces macrolides. L'inactivation de cette ou de ces proteines peut etre effectuee par 
toute methode connue de l'homme du metier, par exemple par mutagenese dans le ou 

10 les genes codant ladite ou lesdites proteines ou par P expression d'un ou de plusieufs 
ARN anti-sens complementaires de TARN ou des ARN messagers codant ladite ou' 
lesdites proteines. La mutagenese peut, par exemple, etre effectuee par irradiation, par 
action d' agent chimique mutagene, par mutagenese dirigee, par remplacement de gene 
ou toute autre methode connue de Phomme du metier. Les conditions convenables 

15 d'une telle mutagenese peuvent par exemple etre adaptees selon Penseignement contenu 
dans les ouvrages de Kieser, T et al (2000) et Ausubel et al., (2002). La mutagenese 
peut etre effectuee in vitro ou in situ,, par suppression, substitution, deletion et/ou 
addition d'une ou plusieurs bases dans le gene considere ou par inactivation genique. 
Cette mutagenese peut etre effectuee dans un gene comprenant une sequence telle que 

20 decrite ci-dessus. Preferentiellement, les microorganismes bloques dans une etape de la 
voie de biosynthese de macrolides sont des bacteries du genre Streptomyces . Plus 
preferentiellement, l'inactivation de la fonction d'une ou plusieurs proteines impliquees 
dans la biosynthese du ou des macrolides en question est effectuee par mutagenese. 
Encore plus preferentiellement, le macrolide en question est la spiramycine et les 

25 microorganismes dans lesquels sont effectuees la ou les mutageneses sont des souches 
de S. ambofaciens. Plus preferentiellement, la mutagenese est effectuee dans un ou 
plusieurs genes comprenant une des sequences correspondant a une ou plusieurs des 
sequences SEQ ID N° 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 
45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 

30 118, et 120. De fa?on preferee, la ou les mutageneses sont effectuees par inactivation 



1er depot 



78 

genique. De fa?on tout a fait preferee, la mutagenese consiste en Pinactivation genique 
d'un gene comprenant une sequence correspondant a la sequence SEQ ED N° 13. 

.AtifreiUustra^ a titred' exemple 

de tels microorganismes : OS49.16 (orfi:: nhyg, cf. exemple 2), OS49.67 (prf3 deletion 
en phase, cf. exemple <5), OS49.107 (or/8:: Qhyg, cf. exemple 7), OS49.50 
(or/20:; nhyg, cf. exemple 8), SPM21 (prf2::att3Qaac^ cf exemple 10), SPM22 
(prf2::att3 deletion en phase, cf. exemple 10), SPM501 (or/6*::attl<Qhyg+, cf. exemple 
14), SPM502 (orf6*::attl deletion en phase, cf exemple 14), SPM507 
(orfl2::ati3Qaac~, cf. exemple 11), SPM508 (orfI3c::att3Qaac~, cf. exemple 12), 
SPM509 (orfl4::att30aac^ cf. exemple 13). 

Un autre aspect de Pinvention conceme un procede de preparation d'un 
intermediate de biosynthese de macrolide utilisant les microorganismes bloques dans 
une etape de la voie de biosynthese de macrolides, tels que decrits ci-dessus. Le procede' 
consiste a cultiver, dans un milieu de culture approprie, un microorganisme bloque daiis 
une etape de la voie de biosynthese de macrolides, tels que decrits ci-dessus, recuperer 
le milieu de culture conditionne ou un extrait cellulaire, par exemple par sonication ou 
par choc osmotique, separer et purifier a partir dudit milieu de culture ou encore a partir 
de 1' extrait cellulaire obtenu a P etape precedente, ledit intermediate de biosynthese. 
Les conditions de culture de tels microorganismes pourront etre determinees selon des 
techniques bien connues de Phomme du metier. Le milieu de culture pourra par 
exemple etre le milieu MPS ou le milieu SL11 pour les Streptomyces et notamment 
pour Streptomyces ambofaciens (Pernodet et al, 1993). L'homme du metier pourra 
notamment se referer a Pouvrage de Kieser et al (2000) en ce qui concerne la culture 
des Streptomyces. L'intermediaire produit peut etre recupere par toutes techniques 
connues de Phomme du metier. L'homme du metier pourra se referer, par exemple, aux 
techniques enseignees dans le brevet americain US 3,000,785 et plus particulierement 
aux methodes d' extraction des spiramycines decrites dans ce brevet. 
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Un autre objet de 1'invention conceme un procede de preparation d'une molecule 
derivee d'un macroHde utilisant les microorganismes bloques dans une etape de la voie 
de biosynthese de ce macrolide, tels que decrits ci-dessus. Le procede consiste a obtenir 
un intermediaire de biosynthese selon le procede ci-dessus et a modifier 1' intermediaire 
ainsi produit, eventuellement apres separation du milieu de culture. Les conditions de 
culture de tels microorganismes pourront etre determinees selon des techniques bien 
connues de l'homme du metier. Le milieu de culture pourra par exemple etre le milieu 
MP5 ou le milieu SL11 pour les Streptomyces et notamment pour Streptomyces 
ambofaciens (Pernodet et al, 1993). L'homme du metier pourra notamment se referer a 
l'ouvrage de Kieser et al. 2000 en ce qui concerne la culture des Streptomyces. Les 
intermediates produits peuvent etre modifies, eventuellement apres separation, soit par 
ajout de composants appropries dans les milieux de production, soit par introduction 
.dans les microorganismes d'autres genes codant des proteines susceptibles de modifier 
l'intermediaire en s'en servant comme substrat. Ces intermediaires peuvent ainsi efre 
modifies par voie chimique, biochimique, enzymatique et/ou microbiologique. Plus 
preferentiellement, le macrolide en question est la spiramycine et les microorganismes 
dans lesquels sont effectuees la ou les mutageneses sont des souches de S. ambofaciens. 

L'invention est egalement relative a un microorganisme produisant de la 
spiramycine I mais ne produisant pas de spiramycine H et HI. Ce microorganisme 
comprend 1' ensemble des genes necessaires a la biosynthese de la spiramycine I mais ne 
produit pas de spiramycine E et in car le gene comprenant la sequence correspondant a 
SEQ ID N° 13 ou l'un de ses variants ou l'une des sequences derivees de celles-ci en 
raison de la degenerescence du code genetique et codant un polypeptide de sequence 
SEQ ID N° 14 ou l'un de ses variants n'est pas exprime ou a ete rendu inactif. 
L'inactivation de cette proteine peut etre effectuee par toute methode connue de 
l'homme du metier, par exemple par mutagenese dans le gene codant ladite proteine ou 
par l'expression d'un AKN anti-sens complementaire de l'ARN messager codant ladite 
proteine, etant entendu que si l'expression de orf5* est affectee par cette manipulation, 
il sera necessaire de proceder a une autre modification pour que le gene or/5* soit 
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correctement exprime. La mutagenese peut etre effectuee dans la sequence codante ou 
dans une sequence non codante de maniere a rendre inactive la proteine codec ou a en 
empecher son expression ou sa traduction. La mutagenese peut etre effectuee par 
_~ mutagenese dirigee, par remplacement de.gene ou toute autre methode connue de 

5 Thomme du metier. Les conditions convenables d'une telle mutagenese peuvent par 
exemple etre adaptees selon l'enseignement contenu dans les ouvrages de Kieser, T et 
al (2000) et Ausubel et al, 2002. La mutagenese peut etre effectuee in vitro ou in situ, 
par suppression, substitution, deletion et/ou addition d'une ou plusieurs bases dans le 
gene considere ou par inactivation genique. Le microorganisme peut etre egalement 

10 obtenu en exprimant les genes de la voie de biosynthese de la spiramycine sans que 
ceux-ci ne comprennent le gene comprenant la sequence SEQ ID N° 13 ou l'un de ses 
variants ou l'une des sequences derivees de celles-ci en raison de la degenerescence du 
code genetique et codant un polypeptide de sequence SEQ ID N° 14 ou l'un de ses 
variants. Preferentiellement, le microorganisme est une bacterie du genre Streptomyces. 

15 Plus preferentiellement, le microorganisme produisant de la spiramycine I mais ne 
produisant pas de spiramycine II et IE est obtenu a partir d'un microorganisme de depart 
produisant les spiramycines I, II et III. Encore plus preferentiellement, le 
microorganisme est obtenu par mutagenese dans un gene comprenant la sequence 
correspondant a SEQ ID N° 13 ou l'un de ses variants ou l'une des sequences deriveCs ; 

20 de celles-ci en raison de la degenerescence du code genetique et codant un polypeptide 
de sequence SEQ ID N° 14 ou l'un de ses variants ayant la meme fonction. Encore plus 
preferentiellement, cette mutagenese est effectuee par inactivation genique. De maniere 
preferee le microorganisme est obtenu a partir d'une souche de S. ambofaciens 
produisant les spiramycines I, n et IE dans laquelle est effectuee une inactivation 

25 genique du gene comprenant la sequence correspondant a SEQ ID N° 1 3 ou l'une des 
sequences derivees de celle-ci en raison de la degenerescence du code genetique. De 
maniere tout a fait preferee, 1' inactivation genique est effectuee par deletion en phase du 
gene ou d'une partie du gene comprenant la sequence correspondant a SEQ ID N° 13 ou 
l'une des sequences derivees de celle-ci en raison de la degenerescence du code 

' 30 genetique. A litre illustratif, la souche SPM502 (orf6*::attI, cf. exemple 14) peut etre 
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citee comme un microorganisme produisant de la spiramycine I mais ne produisant pas 
de spiramycine II et III 

L'invention est egalement relative a un microorganisme produisant de la 
spiramycine I mais ne produisant pas de spiramycine II et III tel que decrit ci-dessus 
5 caracterise en ce en ce qu'il surexprime en outre : 

- un gene susceptible d'etre obtenu par amplification en chame par polymerase en 
utilisant le couple d'amorces de sequence suivante : 5' 
AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ID N° 138) et 5' 
GGATCCCGCGACGGACACGACCGCCGCGCA 3' (SEQ ID N° 139) et comme 

10 matrice le cosmide pSPM36 ou l'ADN total de Streptomyces ambofaciens 

- ou un gene derive de celui-ci en raison de la degenerescence du code genetique. 

.Un exemple de sequence d'un tel gene est donnee en SEQ ID N° 111 (ADN), cependant 
cette sequence est partielle pxiisqu'elle ne comprend pas la partie 3' de la sequence 
codante correspondante. La traduction en proteine de cette partie de sequence codante 

15 est donnee en SEQ ID N° 112. L'homme du metier pourra aisement la completer 
notamment en utilisant Penseignement presente dans 1'exemple 24. II est ainsi presente 
dans cet exemple une methode pour doner le gene or/2 8c et pour fabriquer un yecteur 
d'expression permettant V expression de orf28c. II est egalement montre dans cet : 
exemple que la surexpression du gene orf28c dans la souche OSC2 conduit a 

20 Famelioration de la production en spiramycines de cette souche. La surexpression du ; 
gene orf28c peut etre obtenue en augmentant le nombre de copies de ce gene et/ou en 1 
pla9ant un promoteur plus actif que le promoteur sauvage. De fa<?on preferee, la 
surexpression dudit gene est obtenue en apportant dans le microorganisme une 
construction d'ADN recombinant, permettant la surexpression de ce gene. De facpon 

25 preferee, cette construction d'ADN recombinant augmente le nombre de copie dudit 
gene et permet d'obtenir une surexpression dudit gene. Dans cette construction d'ADN 
recombinant, la sequence codante du gene peut etre placee sous le controle d'un 
promoteur plus actif que le promoteur sauvage. On peut citer a titre d' illustration le 
promoteur ptrc actif chez Streptomyces ambofaciens (Amann, E. et al, 1988) ainsi que 
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le promoteur ermE*. Ainsi, de fa?on preferee, la ou les copies du gene orf28c apportee 
sont placees sous le controle du promoteur ermE* comme c'est le cas dans la 
construction pSPM75 (cf. exemple 24). 

L'invention est egalement relative a un microorganisme produisant de la 
5 spiramycine I mais ne produisant pas de spiramycine II et III tel que decrit ci-dessus 
caracterise en ce en ce qu'il surexprime en outre le gene de sequence codante SEQ ID 
N° 47 ou d'une sequence codante derivee de celle-ci en raison de la degenerescence 
du code genetique. Preferentiellement, ce microorganisme est caracterise en ce qu'il 
s'agit de la souche SPM502 pSPM525 deposee aupres de la Collection Nationale de 
1 id ' Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur Roux 
75724 Paris Cedex 15, France, le 26 fevrier 2003 sous le numero d'enregistrement I- 
2977. 

L'invention est egalement relative a un procede de production de spiramycine I, le 
precede consiste a cultiver dans un milieu de culture approprie un microorganisme : 

15 produisant de la spiramycine I mais ne produisant pas de spiramycine II et III tel que 
decrit ci-dessus, recuperer le milieu de culture conditionne ou un extrait cellulaire, 
separer et purifier a partir dudit milieu de culture ou encore a partir de Pextrdit 
cellulaire obtenu a Petape precedente la spiramycine L Les conditions de culture de tel 
microorganisme pourront etre determinees selon des techniques bien connues de . 

20 rhomme du metier. Le milieu de culture pourra par exemple etre le milieu MP 5 ou le 
milieu SL11 pour les Streptomyces et notamment pour Streptomyces ambofaciens 
(Pernodet et ah, 1993). L'homme du metier pourra notamment se referer a Fouvrage de 
Kieser et al. 2000 en ce qui concerne la culture des Streptomyces. La spiramycine I 
produite peut etre recuperee par toutes techniques connues de rhomme du metier. 

25 L'homme du metier pourra se referer, par exemple, aux techniques enseignees dans le 
brevet americain US 3,000,785 et plus particulierement aux methodes d'extraction des 
spiramycines decrites dans ce brevet. 
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Un autre aspect de l'invention concerne l'utilisation d'une sequence nucleotidique 
selon l'invention pour ameliorer la production en macrolides d'un microorganisme. 
Ainsi, l'invention concerne un microorganisme mutant producteur de macrolide 
caracterise en ce qu'il possede une modification genetique dans au moins un gene 
comprenant une sequence telle que definie ci-dessus et/ou qu'elle surexprime au moins 
un gene comprenant une sequence telle que definie ci-dessus. La modification genetique 
peut consister en une suppression, une substitution, une deletion et/ou une addition d'une 
ou plusieurs bases dans le ou les genes consideres dans le but d'exprimer une ou des 
proteines ayant une activite superieure ou d'exprimer un niveau plus eleve de cette ou de 
ces proteines. La surexpression du gene considere peut etre obtenue en augmentant le 
nombre de copies de ce gene et/ou en placant un promoteur plus actif que le promoteur 
sauvage. On peut citer a litre d'illustration le promoteur ptrc actif chez Streptomyces 
ambofaciens (Amann, E. et al, 1988) ainsi que le promoteur ermE* (Bibb et al, 1985), 
(Bibb et al, 1994). Ainsi la surexpression du gene considere peut etre obtenue en 
apportant dans un microorganisme producteur du macrolide considere une construction 
d'ADN recombinant selon l'invention, permettant la surexpression de ce gene. En effet, 
certaines etapes de la biosynthese des macrolides sont limitantes et si Ton exprime une 
ou plusieurs proteines plus actives ou un niveau d' expression plus important de la.ou des 
proteines sauvages impliquees dans ces etapes limitantes, on peut ameliorer la 
production du ou des macrolides concernes. Une augmentation du taux de production de 
la tylosine a par exemple ete obtenue chez Streptomyces fradiae par duplication du gene 
codant une methyl transferase limitante convertissant la macrocine en tylosine (Baltz R, 
1997). L'obtention de l'expression d'une proteine plus active peut etre obtenue 
notamment par mutagenese, l'homme du metier pourra par exemple se referer a ce sujet 
a l'ouvrage de F.Ausubel et al (2002). Preferentiellement, ces microorganismes mutants 
ameliores pour leur production en macrolides sont des bacteries du genre Streptomyces. 
Plus preferentiellement, le macrolide en question est la spiramycine et les 
microorganismes dans lesquels sont effectuees la ou les mutageneses sont des souches 
de S. ambofaciens. Plus preferentiellement, la modification genetique est effectuee dans 
un ou plusieurs genes comprenant une des sequences correspondant a une ou plusieurs 
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des sequences SEQ ID N° 3, 5, 7, 9, 1 1, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 
45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 
1 18, et 120, ou l'un de ses variants ou l'une des sequences derivees de celles-ci enraison 
de la degenerescence du code genetique. De facon preferee, le microorganisme 
surexprime un ou plusieurs genes comprenant une des sequences correspondant a une ou 
plusieurs des sequences SEQ ID N° 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 
36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 
111, 113, 115, 118, et 120, ou l'un de ses variants ou l'une des sequences derivees de 
celles-ci en raison de la degenerescence du code genetique. De facon prefer6e, le 
microorganisme swexprime le gene comprenant une sequence correspondant a SEQ ID 
N° 1 1 i, ou l'un de ses variants ou l'une des sequences derivees de celles-ci en raison de 
la degenerescence du code genetique. La sequence donnee en SEQ ID N° 111 est. 
partielle, cependant rhomme du metier pourra aisement la completer notamment en 
utilisant l'enseignement presente dans 1'exemple 24. II est ainsi presente dans cet 
exemple une methode pour doner le gene orf28c et pour fabriquer un vecteur 
d'expression permettant l'expression de orf28c. II est egalement montre dans cet 
exemple que la surexpression du gene orJ28c dans la souche OSC2 conduit a 
l'amelioration de la production en spiramycines de cette souche. La surexpression du 
gene orf28c peut etre obtenue en augmentant le nombre de copies de ce gene et/ou en 
placant un promoteur plus actif que le promoteur sauvage. De facon preferee, la 
surexpression du gene orf28c est obtenue en apportant dans le microorganisme urie 
construction d'ADN recombinant, permettant la surexpression de ce gene. De facon 
preferee, cette construction d'ADN recombinant augmente le nombre de copie du gene 
orf28c et permet d'obtenir une surexpression du gene orf28c. Dans cette construction 
d'ADN recombinant, la sequence codante de orf28c peut etre placee sous le controle 
d'un promoteur plus actif que le promoteur sauvage. On peut citer a titre d' illustration le 
promoteur ptrc actif chez Streptomyces ambofaciens (Amann, E. et al., 1988) ainsi que 
le promoteur ermE*. Ainsi, de facon preferee, la ou les copies du gene orf28c apportee 
sont placees sous le contrSle du promoteur ermE* comme c'est le cas dans la 
construction pSPM75 (cf. exemple 24). 



1er depot 



85 



Un autre aspect de 1' invention coneerne un procede de production de macrolides 
utilisant les microorganismes decrits au paragraphe precedent." Ce procede consiste a 
cultiver dans un milieu de culture approprie un microorganisme defini dans le 
paragraphe precedent, recuperer le milieu de culture conditionne ou un extrait cellulaire, 
separer et purifier a partir dudit milieu de culture ou encore a partir de 1' extrait 
cellulaire obtenu a l'etape precedente le ou les macrolides produits. Les conditions de 
culture de tels microorganismes pourront etre determinees selon des techniques bien 
connues de l'homme du metier. Le milieu de culture pourra par exemple etre le milieu 
MP5 ou le milieu SL11 pour les Streptomyces et notamment pour Streptomyces 
ambofaciens (Pemodet et al., 1993). L'homme du metier pourra notamment se referer a 
l'ouvrage de Kieser et al. 2000 en ce qui coneerne la culture des Streptomyces. Le ou les 
macrolides produits peuvent etre recuperes par toutes techniques connues de l'homme 
du metier. L'homme du metier pourra se referer, par exemple, aux techniques 
enseignees dans le brevet americain US 3,000,785 et plus particulierement.-aux 
methodes d'extraction des spiramycines decrites dans ce brevet. Preferentiellement, les 
microorganismes utilises dans un tel procede sont des bacteries du genre Streptomyces. 
Plus preferentiellement, le macrolide en question est la spiramycine et les 
microorganismes mutants ameliores pour leur production en spiramycines sont des 
souches de S. ambofaciens. 

Un autre aspect de 1' invention coneerne 1 'utilisation d'une sequence et/ou d'un 
vecteur selon 1' invention pour la preparation d'antibiotiques hybrides. En effet, les 
polynucleotides selon 1'invention peuvent servir a l'obtention de microorganismes 
exprimant une ou plusieurs proteines mutantes donnant lieu a une modification dans la 
specificite du substrat ou encore etre exprimes dans de multiples microorganismes 
producteurs d'antibiotiques dans le but de generer des antibiotiques hybrides. Ainsi les 
polynucleotides selon 1'invention peuvent permettre, par transfert des genes entre 
microorganismes producteurs, de fabriquer des antibiotiques hybrides ayant des 
proprietes pharmacologiquement interessantes (Hopwood et al, 1985a, Hopwood et 
al, 1985b, Hutchinson et al, 1989). Le principe par lequel l'ingenierie genetique peUt 
conduire a la production d'antibiotiques hybrides a ete tout d'abord propose par 
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Hopwood (Hopwood 1981). II a ainsi ete propose que les enzymes participant a la 
biosynthese d' antibiotiques acceptent souvent des substrats relies stracturellement, mais 

differents _de _leur substrat nature!. II est generalement admis (Hopwood 1981, 

Hutchinson 1988, Robinson 1988) que les enzymes codees par les genes de la voie de 
5 biosynthese d'antibiotiques ont une specificite de substrat moins stricte que les enzymes 
du metabolisme primaire. II a ainsi pu etre montre qu'un grand nombre de substrats non- 
naturels sont transformes par des microorganismes producteurs d'antibiotique, leur 
mutants ou des enzymes purifiees de la voie de biosynthese de ces antibiotiques 
(Hutchinson 1988). En utilisant cet enseignement, Phomme du metier pourra construire 

10 des microorganismes exprimant une ou plusieurs proteines mutantes dormant lieu a une 
modification dans la specificite du substrat dans le but de generer des antibiotiques 
hybrides. 

L/invention concerne egalement Putilisation d'au moins un polynucleotide et/ou 
au moins un ADN recombinant et/ou au moins un vecteur d f expression et/ou au moins s 

15 un polypeptide et/ou au moins une cellule hote selon 1 'invention pour realiser une oil ' 
plusieurs bioconversions. Ainsi Pinvention permet de construire des souches ; 
bacteriermes ou fongiques dans lesquelles on exprime, sous le controle de signaux 
d'expression appropries, une ou plusieurs proteines selon Pinvention. De telles souches 
peuvent alors etre utilisees pour realiser une ou des bioconversions. Ces bioconversions 

20 peuvent se faixe soit a Taide de cellules entieres, soit a Taide d f extraits acellulaires des 

dites cellules. Ces bioconversions peuvent permettre de transformer une molecule en une :: . ' 
forme derivee, avec une enzyme d r une voie de biosynthese. Par exemple, Carreras et al: 
decrit Putilisation de souche de Saccharopolyspora erythraea et de Streptomyces 
coelicolor pour la production de nouveau derives d'erithromycines (Carreras et aL, 

25 2002). Walczar et al decrit Putilisation d'une P450 mono-oxygenase de Streptomyces 
pour la bioconversion de desacetyladriamycine (un analogue de Panthracycline) en de 
nouvelles anthracyclines (Walczar et al, 2001). Olonao et al decrit Putilisation d'une 
souche de Streptomyces lividans modifiee pour la bioconversion de rhodomycinone- 
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epsilon en rhodomycine D (Olonao et al, 1999). L'homme du metier pourra appliquer 
ce principe a tout intermediaire de biosynthese. 

L'invention concerne egalement un ADN recombinant caracterise en ce qu'il 
comprend : 

5 - un polynucleotide susceptible d'etre obtenu par amplification en chaine par 
polymerase en utilisant le couple d' amorces de sequence suivante : 5 ? 
AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ID N° 138) et 5' 
GGATCCCGCGACGGACACGACCGCCGCGCA 3' (SEQ ID N° 139) et comme 
matrice le cosmide pSPM36 ou V ADN total de Streptomyces ambofaciens 

10 - ou un fragment d'au moins 10, 12, 15, 18, 20 a 25, 30, 40, 50, 60, 70, 80, 90, 100, 
150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 
1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1460, 1470, 1480, 
1490 ou 1500 nucleotides consecutifs de ce polynucleotide. 
Pr6ferentiellement ; cet ADN recombinant est un vecteur. Encore plus/ 

15 preferentiellement, le vecteur est choisi parmi les bacteriophages, les plasmides, les 
phagemides, les vecteurs integratifs, les fosmides, les cosmides, les vecteurs navettes, 
les BAC (Bacterial Artificial Chromosome) ou les PAC (PI -derived Artificial 
Chromosome). A titre illustratif on peut citer comme bacteriophages le phage lambda = 
et le phage Ml 3. Comme plasmides on peut citer les plasmides se repliquant chez E. 

20 coli par exemple pBR322 et ses derives, pUC18 et ses derives, pUC19 et ses derives, 
pGB2 et ses derives (Churchward G. et ah, 1984), pACYC177 (numero d'acces 
GenBank : X06402) et ses derives, pACYC184 (numero d'acces GenBank : X06403) 
et ses derives. On peut egalement citer les plasmides se repliquant chez Streptomyces 
comme par exemple pIJlOl et ses derives, pSG5 et ses derives, SLP1 et ses derives, 

25 SCP2* et ses derives (Kieser et al 2000). Comme phagemides on peut citer a titre 
illustratif pBluescript II et ses derives (commercialises notamment par la societe 
Stratagene (LaJolla, Californie, USA)), pGEM-T et ses derives (commercialise par la 
societe Promega (Madison, Wisconcin, USA)), XZAPII et ses derives 
(commercialises notamment pax la society Stratagene (LaJolla, Californie, USA)). 
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Comme vecteurs integratifs on peut citer a titre illustratif, les vecteurs integratifs 
chez Streptomyces comme par exemple ceux derives de SLP1 (Kieser et al, 2000), 
ceux derives de pSAM2 (Kieser et al, 2000), les vecteurs utilisant les systemes 
d'integration- des phages PhiC31 (Kieser et al 9 2000) (par exemple pSET152 
5 (Bierman et ah, 1992)) ou de VWB (Van Mellaert L, et ah 1998), ainsi que les 
vecteurs utilisant le systeme d'integration de IS117 (Kieser et al. 2000). Comme 
fosmides on peut citer a titre illustratif le fosmide pFOSl (commercialise par la 
societe New England Bioloabs Inc., Beverly, Massachusetts, USA) et ses derives. 
Comme cosmides on peut citer a titre illustratif le cosmide SuperCos et ses derives 

10 (commercialises notamment par la societe Stratagene (LaJolla, Californie, USA)), le 
cosmide pWED15 (Wahl et al,, 1987) et ses derives. Comme vecteurs navettes on 
peut citer a titre illustratif les plasmides navettes E. coli I Sfreptomyces comme par 
exemple pIJ903 et ses derives, la serie des plasmides pUWL, pCAO106, pWHM3, 
pOJ446 et leurs derives (Kieser et ah 2000), les BAC navettes E. coli I Streptomyces 

15 comme par exemple ceux decrits dans la demande de brevet WO 01/40497. Comme 
BAC (Bacterial Artificial Chromosome) on peut citer a titre illustratif le BAC 
pBeloBACll (numero d'acces GenBank :U51 1 13). Comme PAC (Pl-derived 
Artificial Chromosome) on peut citer a titre illustratif le vecteur pCYPAC6 (numero 
d'acces GenBank : AF133437). Plus preferentiellement, cet ADN recombinant est un 

20 vecteur depression. Les vecteurs d' expression utilisables dans differents systemes 
d'expression sont bien connus de Fhomme du metier, en ce qui concerne les cellules 
procaryotes, on peut citer a titre illustratif les vecteurs d'expression chez E. coli par 
exemple, de la famille pET commercialises par la societe Stratagene (LaJolla, 
Californie, USA), les vecteurs de la famille GATEWAY commercialises par la 

25 societe Invitrogen (Carlsbad, Californie, USA), les vecteurs de la famille pBAD 
commercialises par la societe Invitrogen (Carlsbad, Californie, USA), les vecteurs de 
la famille pMAL commercialises par la societe New England Bioloabs Inc. (Beverly, 
Massachusetts, USA), les vecteurs d'expression inductibles par le rhamnose cites 
dans la publication Wilms B et ah, 2001 et leurs derives, on peut egalement citer les 

30 vecteurs d'expression chez Streptomyces comme par exemple les vecteurs pIJ4123, 
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pIJ6021, pPM927, pANT849, pANT 850, pANT 851, pANT1200, pANT1201, 
pANT1202 et leurs derives (Kieser et al, 2000). En ce qui concerne les cellules de 
levures, on peut citer a titxe illustratif le vecteur pESC commercialise par la societe 
Stratagene (LaJolla, Californie, USA). En ce qui concerne le systeme depression 

5 baculovirus permettant une expression dans des cellules d'insectes on peut citer a titre 
illustratif le vecteur BacPAK6 commercialise par la societe BD Biosciences 
Clontech, (Palo Alto, Califomie, USA). En ce qui concerne les cellules de 
mammiferes, on peut citer a titre illustratif des vecteurs comprenant le promoteur des 
genes precoces du virus CMV (Cytomegalovirus) (par exemple le vecteur pCMV et 

10 ses derives commercialises par la societe Stratagene (LaJolla, Californie, USA), ou le 
promoteur des genes immediats (SV40 early promoter) du virus simien vacuolisant 
SV40 (par exemple le vecteur pSG5 commercialise par la societe Stratagene (LaJolla, 
Californie, USA). Un autre aspect de P invention concerne des cellules hotes dans 
laquelle a ete introduit au moins un ADN recombinant decrit dans ce paragraphe. : , 

15 Un autre aspect de 1'invention concerne un procede de production d'un " 

polypeptide caracterise en ce que ledit procede comprend les etapes suivantes: 

a) transformer une cellule hote par au moins un vecteur d' expression tel que 
decrit dans le paragraphe ci-dessus; 

b) cultiver, dans un milieu de culture approprie, ladite cellule hote; 
20 c) recuperer le milieu de culture conditionne ou un extrait cellulaire; 

d) separer et purifier a partir dudit milieu de culture ou encore a partir de 
Fextrait cellulaire obtehii a Fetape c), ledit polypeptide.; 

e) le cas echeant, caracteriser le polypeptide recombinant produit. 

Le polypeptide recombinant ainsi produit peut etre purifie par passage sur une 
25 serie appropriee de colonnes de chromatographic, selon les methodes connues de 
l'homme de l'art et decrites par exemple dans F. Ausubel et al (2002). On peut citer a 
titre illustratif la technique du « Tag-Histidine », qui consiste a ajouter une courte 
sequence poly-histidine au polypeptide a produire, ce dernier pouvant ensuite etre 
purifie sur colonne de nickel. Ce polypeptide peut egalement etre prepare par les 
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techniques de synthese in vitro, A titre illustratif de telles techniques, le polypeptide 
pouxra etre prepare grace au systdme « rapid translation system (RTS)», commercialise 
notamment par la societe Roche Diagnostics France S.A, Meylan, France. 

Un autre aspect de l'invention concerne un microorganisme producteur d'au 

5 moins une spir amy cine caracterise en ce qu'il surexprime : 

-un gene susceptible d'etre obtenu par amplification en chaine par polymerase (PCR) en 
utilisant le couple d 5 amorces de sequence suivante : 5' 
AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ID N° 138) et 5' 
GGATCCCGCGACGGACACGACCGCCGCGCA 3 9 (SEQ ID N° 139) et comme 

10 matrice le cosmide pSPM36 ou PADN total de Streptomyces ambofaciens, 

- ou un gene derive de celui-ci en raison de la degenerescence du code genetique. 

Un exemple de sequence d'un tel gene est donne en SEQ ID N° 111 (ADN), cependant 
cette sequence est partielle puisqu'elle ne comprend pas la partie 3' de la sequence 
codante correspondante. La traduction en proteine de cette partie de sequence codante 

15 est donnee en SEQ ID N° 112. L'homme du metier pourra aisement la completer 
notamment en utilisant Penseignement presente dans P exemple 24. II est ainsi presente 
dans cet exemple une methode pour doner le gene orf28c et pour fabriquer un vecteur 
d' expression permettant V expression de orf28c. II est egalement montre dans cet ; 
exemple que la surexpression du gene orf28c dans la souche OSC2 conduit a 

20 F amelioration de la production en spiramycines de cette souche. De fa9on preferee, le 
microorganisme surexprimant 

- un gene susceptible d'etre obtenu par amplification en chaine par polymerase (PCR) en 
utilisant le couple d'amorces de sequence suivante : 5' 
AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ID N° 138) et 5 ? 

25 GGATCCCGCGACGGACACGACCGCCGCGCA 3' (SEQ ID N° 139) et comme 
matrice le cosmide pSPM36 ou FADN total de Streptomyces ambofaciens, 

- ou un gene derive de celui-ci en raison de la degenerescence du code genetique 

est une bacterie du genre Streptomyces, de maniere encore plus preferee, il s'agit d'une 
bacterie de Fespece Streptomyces ambofaciens. De fa£on preferee, la surexpression 
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dudit gene est obtenue par transformation dudit microorganisme par un vecteur 
d'expression, de maniere tout a fait prefere, la souche de microorganisme est la souche 
OSC2/pSPM75(l) ou de la souche OSC2/pSPM75(2). 

Un autre aspect de 1' invention concerne un precede de production de 

5 spiramycine(s) utilisant les microorganismes decrits au paragraphe precedent. Ce 
procede consiste a cultiver dans un milieu de culture approprie un microorganisme 
defini dans le paragraphe precedent, recuperer le milieu de culture conditionne ou un 
extrait cellulaire, separer et purifier a partir dudit milieu de culture ou encore a partir de 
l'extrait cellulaire obtenu a l'etape precedente le ou les spiramycines produites. Les 

10 conditions de culture de tels microorganismes pourront etre determinees selon des 
techniques bien connues de l'homme du metier. Le milieu de culture pourra par 
exemple etre le milieu MP5 ou le milieu SL11 pour les Streptomyces et notammeht 
pour Streptomyces ambofaciens (Pernodet et al., 1993). L'homme du metier pourra 
notamment se referer a l'ouvrage de Kieser et al. 2000 en ce qui concerne la culture des 

15 Streptomyces. Le ou les spiramycines produites peuvent etre recuperes par toutes 
techniques connues de rhomme du metier. L'homme du metier pourra se referer, par- 
exemple, aux techniques enseignees dans le brevet americain US 3,000,785 et plus 
particulierement aux methodes d' extraction des spiramycines decrites dans ce brevet. 
Preferentiellement, les microorganismes utilises dans un tel procede sont des bacteries 

20 du genre Streptomyces. Plus preferentiellement, les microorganismes sont des souches 
de S: ambofaciens. 

Un autre aspect de l'invention conceme un vecteur d'expression caracterise 
en ce que le polynucleotide de sequence SEQ ID N° 47 ou un polynucleotide derive 
de celui-ci en raison de la degenerescence du code genetique est place sous le 
25 controle d'un promoteur permettant l'expression de la proteine codee par le dit 
polynucleotide chez Streptomyces ambofaciens. Des exemples de vecteurs 
d'expression utilisables chez Streptomyces ont ete donnes ci-dessus. 
Preferentiellement un tel vecteur d'expression est caracterise en ce qu'il s'agit du 
plasmide pSPM524 ou pSPM525. 
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Un autre aspect de Pinvention conceme une souche de Streptomyces 
ambofaciens transf brmee par un vecteur defini dans ie paragraphe precedent. 

Un autre aspect" de 1' invention conceme un polypeptide caracterise en-ee que - 
sa sequence comprend la sequence SEQ ID N° 112. L'invention est egalement 
5 relative a un polypeptide caracterise en ce que sa sequence correspond a la sequence 
traduite de la sequence codante : 

- d'un gene susceptible d'etre obtenu par amplification en chaine par 
polymerase (PCR) en utilisant le couple d' amorces de sequence suivante : 5' 
AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ID N° 138) et 5' 
10 GGATCCCGCGACGGACACGACCGCCGCGCA 3' (SEQ ID N° 139) et comme 
matrice le cosmide pSPM36 ou l'ADN total de Streptomyces ambofaciens, 

-ou d'un gene derive de celui-ci en raison de la degenerescence du code 
genetique. 

Preferentiellement ces polypeptides sont exprimes a l'etat naturel par une bacterie du 
15 genre Streptomyces, plus preferentiellement, ces polypeptides sont impliques dans la 
biosynthese des spiramycines. 

Un autre aspect de V invention conceme un vecteur d' expression permettant 
r expression d'un polypeptide tel que defini dans le paragraphe precedent chez 
Streptomyces ambofaciens. Des exemples de vecteurs d'expression utilisables chez 
20 Streptomyces ont ete donnes ci-dessus. Preferentiellemnt, le vecteur d'expression en 
question est le plasmide pSPM75. 

LISTE DES FIGURES 

Figure 1 : Structure chimique des spiramycines I, II et III. 
Figure 2 : Cosmides utilises pour le sequen9age de la region. 
25 Figure 3 : Organisation d'un groupe de genes impliques dans la voie de biosynthese des 
spiramycines. 

Figure 4 : Voie de biosynthese proposee du mycarose. 
Figure 5 : Voie de biosynthese proposee du mycaminose. 
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Figure 6 : Voie de biosynthese proposee de la forosamine. 

Figure 7 : Ordre preferentiel d'ajout des sucres dans la molecule de spiramycine et 
intermediaires. 

Figure 8 : Voie de biosynthese proposee du methoxymalonyl chez S. ambofaciens. Cette = 
5 voie est proposee par analogie avec la biosynthese du methoxymalonyl chez 
Streptomyces hygroscopicus van ascomyceticus (Wu,K. et a/., 2000), 
Figure 9 : Etapes conduisant a Tinactivation d'un gene: 

A) Clonage du gene cible dans un vecteur se repliquant chez E. coli et pas chez 

Streptomyces; 

10 B) Insertion de la cassette dans le gene cible (par clonage ou recombinaison 

entre courtes sequences identiques); 

C) Introduction du plasmide chez Streptomyces ambofaciens (par 
transformation ou conjugaison) et selection des clones ayant integre la cassette : 
puis criblage de clones ayant perdu la partie vecteur pour avoir un remplacement 

15 de gene; 

D) Souche mutante dans laquelle le gene cible est inactive. t . 
Figure 10 : Etapes optionnelles suivant Pinactivation d'un gene selon la methode decrite 
en figure 9, pouvant etre conduites si une cassette excisable a ete employee pour 
interrompre le gene cible : 

20 E) Introduction dans la souche mutante du plasmide pOSV508 portant les genes 

xis et int de pSAM2 dont les produits vont permettre I'excision efficace par 
recombinaison specifique de site de la cassette; 

F) Obtention de clones ayant perdu la cassette excisable et sensibles a 
Tantibiotique a laquelle la cassette donnait la resistance; 
25 G) Apres croissance et sporulation sur milieu solide sans antibiotique le 

plasmide pOSV508 est perdu a haute frequence. On peut obtenir des clones 
sensibles au thiostrepton dans lesquels le g^ne cible contient une deletion en 
phase. La sequence du gene cible delete peut etre controlee par PCR et 
sequen9age du produit PCR. 
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Figure 11 : Amplification de la cassette excisable dans le but de l'utiliser pour une 
experience de recombinaison homologue. La technique de recombinaison homologue 
grace a de courtes sequences homologies a ete decrite par (Chaveroche et aL, 2000), Les 
39 ou 40 deoxy-nucleotides situes a Textremite 5' de ces oligonucleotides comportent 
5 une sequence correspondant a une sequence du gene a inactiver et les 20 deoxy- 
nucleotides situes le plus en 3* correspondent a la sequence dune des extremites de la 
cassette excisable. 

Figure 12 : Qbtention d'une construction pour Finactivation d'un gene cible grace a la 
technique decrite par (Chaveroche et al. 9 2000). 

10 Figure 13 : Carte du plasmide pWHM3. Strepto ori : origine de replication 
Streptomyces. 

Figure 14 : Carte du plasmide pOSV508. 

Figure 15 : Exemple de structure d'une cassette excisable. Celle-ci est constitute de la 
cassette Ohyg (Blondelet-Rouault et al 9 1997) bordee des sites attR et attL (Raynal et 
15 aL, 1998), entre lesquels un evenement de recombinaison permettra l'excision de la 
cassette, grace a V expression des genes xis et int. 
Figure 16 : Carte du plasmide pBXL 1111. 
Figure 17 : Carte du plasmide pBXLl 1 12. 

Figure 18 : Test microbiologique de production en spiramycine, base sur la sensibilite 
20 d'une souche de Micrococcus luteus a la spiramycins La souche de Micrococcus luteus 
utilisee est une souche naturellement sensible a la spiramycine mais resistante a la 
congocidine. Les differentes souches de Streptomyces a tester ont ete cultivees en 
erlenmeyers de 500 ml contenant 70 ml de milieu MPS, inocules a une concentration 
initiale de 2.5 10 6 spores/ml et mises a pousser a 27°C sous agitation orbitale de 250 
25 rpm. Des prelevements de mouts de fennentation ont ete realises apres 48, 72 et 96 
heures de culture et centrifuges. Une dilution au dixieme de ces surnageants dans du 
milieu de culture sterile est utilisee pour le test. La souche indicatrice de Micrococcus 
luteus resistante a la congocidine mais sensible a la spiramycine (Gourmelen et aL, 
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1998) a ete cultivee dans une boite carree de 12x12 cm. Des disques en papier Whatman 
AA ont ete imbibes de 70 jxl de la dilution au dixieme de chaque sumageant et deposes 
sur la surface de la boite. Des disques imbibes d'une solution de spiramycine de 
differentes concentrations (2-4-8 |ig/ml dans du milieu de culture MPS) sont utilises 
comrae gamme 6talon. Les boites sont incubees a 37°C pendant 24 a 48h. Si le disque 
contient de la spiramycine, celle-ci diffuse dans Pagar et inhibe la croissance de la 
souche indicatrice de Micrococcus luteus. Cette inhibition cree un « halo » autour du 
disque, ce halo refletant la zone ou la souche de Micrococcus luteus n'a pas pousse. La 
presence de ce halo est done une indication de la presence de spiramycine et permet de 
determiner si la souche de S. ambofaciens correspondant au disque en question est 
productrice ou non productrice de spiramycine. Une comparaison avec les diametres 
d'inhibition obtenus pour la gamme etalon permet d'obtenir une indication de la quantity 
de spiramycine produite par cette souche. 

Figure 19 : Chromatogramme CLHP du surnageant filtre du milieu de culture de la 
souche OSC2. 

Figure 20 : Chromatogramme CLHP du surnageant filtre du milieu de culture de la 
souche SPM501. 

Figure 21 : Chromatogramme CLHP du surnageant filtre du milieu de culture de la 
souche SPM502. 

Figure 22 : Chromatogramme CLHP du surnageant filtre du milieu de culture de la 
souche SPM507. 

Figure 23 : Chromatogramme CLHP du surnageant filtre du milieu de culture de la 
souche SPM508. 

Figure 24 : Chromatogramme CLHP du surnageant filtre du milieu de culture de la 
souche SPM509. 

Figure 25 : Alignement de la proteine Orf3 (SEQ ID N° 29) avec la proteine TylB (SEQ 
ID N° 87) de S. fradiae realise grace au programme FASTA. 

Figure 26 : Alignement de la proteine MdmA de S. mycarofaciens (SEQ ID N° 88) avec 
la proteine SrmD (SEQ ID N° 16) realise grace au programme FASTA. 
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Figure 27 : Exemple de sequences des sites residuels apres excision de la cassette 
excisable. En gras est indique le site att26 minimum tel que defini dans Raynal et aL, 
1998._ La_ sequence de_ la phase, l._(attl) de 33 nucleotides est presentee en SEQ ID N° 
. , 10.4, la sequence de la phase 2 (att2) de 34 nucleotides est presentee en SEQ ID N° 1 05 5 
. 5 la sequence de la phase 3 (att3) de 35 nucleotides est presentee en SEQ ID N° 95 .Figure 
28 : Representation schematique du gene orflO, localisation des amorces PCR utlisees 
et construction obtenue avec chaque couple d'amorces. 
Figure 29 : Construction de la cassette pac-oritT. 
Figure 30 : Carte du cosmide pWED2. 

10 Figure 31 : Representation schematique du groupe de genes impliques dans la voie de 
biosynthese des spiramycines et de la localisation des trois sondes utilisees pour isoler 
les cosmides de la banque d r ADN genomique de la souche OSC2 de Streptomyces 
ambofaciem chez E. coli (cf. exemple 19y Figure 32 : Localisation des inserts des 
cosmides isoles de la banque d'ADN genomique de la souche OSC2 de Streptomyces 

15 ambofaciens chez E. coli (cf. exemple 19). Figure 33 : Sous clonage du fragment Psil- 
Pstl du cosmide pSPM36 (insert du plasmide (pSPM58), sous clonage du fragment 
Stul-Stul du cosmide pSPM36 (insert du plasmide pSPM72) et sous clonage d'un 
fragment EcoRl-Stul (insert du plasmide pSPM73). 

Figure 34 : Localisation des phases ouvertes de lecture indentifiees dans 1'insert Pstl- 
20 Pstl du plasmide pSPM58 et dans 1'insert EcoRl-Stul du plasmide pSPM73. 

Figure 35 : Superposition des chromatogrammes CLHP du surnageant filtre du milieu 
de culture de la souche OS49.67 realises a 238 et 280nm (haut) et spectres UV des 
molecules ehxes a 33 ? 4 minutes et 44,8 minutes (bas). 

Figure 36 : Structure moleculaire des molecules platenolide A et platenolide B . 
25 Figure 37 : Organisation du groupe de genes impliques dans la voie de biosynthese des 
spiramycines. 
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La presente invention est illustree a l'aide des exemples qui suivent, qui doivent 
etre consideres comme illustratifs et non limitatifs. 

En resume, les genes de la voie de biosynthese des spiramycines ont ete isoles a 
partix d'une banque d'ADN genomique de Streptomyces ambofaciens. Cette banque a ete 
5 obtenue par digestion partielle de l'ADN genomique de Streptomyces ambofaciens, par 
l'enzyme de restriction BarnHL. De larges fragments d'ADN, de 35 a 45 kb en moyehne, 
ont ete clones dans le cosmide pWEDl (Gourmelen et al, 1998) derive du cosmide : 
pWED15 (Wahl et al, 1987). Ces cosmides ont ete introduits chez E. coli grace a des 
particules phagiques. La banque ainsi obtenue a ete hybridee avec une sonde (de 
10 sequence SEQ ID N° 86) correspondant a une partie du gene tylB de S. fradiae (Merson- 
Davies & Cundliffe, 1994, numero d'acces GenBank : U08223). Apres hybridation, un 
cosmide sur les 4 s'hybridant avec la sonde a ete plus particulierement selectionne. Ce 
cosmide nomme pOS49.1 a ensuite ete digere par Sacl et un fragment de 3/3 kb 
contenant la region s'hybridant avec la sonde a ete sous clone dans le vecteur pUC19 et 
15 sequence. Quatre phases ouvertes de lectures ont ete identifiees et l'une d'entre elles 
code une proteine (SEQ ID N° 29) presentant de fortes similitudes de sequence avec la 
proteine TylB de S. fradiae (SEQ ID N° 87) (cf. figure 25). Ce gene a ete nomme or/3 
(SEQ ID N° 28) et a ete inactive chez S. ambofaciens. II a pu etre demontre que les 
clones inactives dans le gene or/3 ne produisent plus de spiramycines. Ceci montre 
20 l'implication du gene or/3 ou de genes situes en aval dans la biosynthese des 
spiramycines. 

Une fois cette confirmation obtenue, une plus grande region du cosmide pOS49.1 
a ete sequencee, de part et d'autre du fragment Sacl precedemment etudie. Ainsi, a partir, 
du cosmide pOS49.1, la sequence d'une region comportant sept phases ouvertes de 
25 lecture entieres et deux autres incompletes, situees de part et d'autre de ces sept phases 
ouvertes completes, a pu etre obtenue. Grace a une recherche dans les bases de donnees, 
il a pu etre montre que l'une des phases ouvertes de lecture incomplete correspondait au 
locus srmG (region codant une enzyme appelee « polyketide synthase » (PKS)). Les 
genes correspondants ont ete clones par Burgett S. et al. en 1996 (Brevet americain US 
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5,945,320). Par ailleurs, les autres phases ouvertes de lecture, les sept ORFs entieres 
nominees : orfl, orf2, orfi, orf4, orfi, orflS, or/7 (SEQ ID N° 23, 25, 28, 30, 34, 36, 40) 
et le debut de la huitieme ORP nomme or/8 (sequence SEQ ED N° 43) n'ont pas ete 
retrouvees dans les bases de donnees. 

5 Dans un deuxieme temps et dans le but de doner d' autres genes impliques dans 

la biosynthese des spiramycines, d'autres cosmides comportant des fragments du 
genome de S. ambofaciens dans cette meme region ont ete isoles. Pour cela une nouvelle 
serie d'hybridations sur colonies a ete effectuee en utilisant trois sondes. La premiere 
sonde correspond a un fragment d'ADN de 3,7kb contenant orfl, orf2 et le debut de 

10 orf3, sous clone a partir de pOS49.1 . La deuxieme sonde correspond a un fragment de 2 
kb d T ADN contenant une partie de orf7 et une partie de orfS et sous clone a partir de 
pOS49.L Une troisieme sonde a egalement ete utilisee. Cette derniere correspond a un 
fragment d'ADN de 1 .8 kb contenant le gene srmD. Le gene srmD est un gene isole de 5. 
ambofaciens capable de conferer la resistance a la spiramycine. En effet, des travaux 

15 anterieurs avaient permis le clonage de plusieurs determinants de resistance de S. 
ambofaciens, conferant la resistance a la spiramycine a une souche de S. griseofuscus 
(souche sensible a la spiramycine) (Pemodet et aL, 1993) (Pemodet et al, 1999). Pour 
Tisolement de genes de resistances, une banque cosmidique de l'ADN genomique de la 
souche S. ambofaciens avait ete realisee dans le cosmide pKC505 (Richardson MA et 

20 ah, 1987). Ce pool de cosmides avait ete introduit chez S. griseofuscus, naturellement 
sensible a la spiramycine. Cinq cosmides capables de conferer la resistance a 
l'apramycine et la spiramycine chez S. griseofuscus avaient ainsi ete obtenus. Parmi ces 
5 cosmides, un cosmide nomme pOS44.1 possede dans son insert le gene srmD qui code 
une proteine presentant une certaine similitude avec la proteine codee par le gene mdmA 

25 de Streptomyces mycarofaciens et impliquee dans la resistance a la midecamycine chez 
cet organisme producteur (Hara et al., 1990, numero d'acces Genbank : A60725) (figure 
26). La troisieme sonde utilisee pour localiser les genes de biosynthese de spiramycine a 
ete un insert d* environ 1.8kb comprenant le gene srmD. 
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Ces trois sondes ont ete utilisees pour hybrider la banque d'ADN genomique 
decrite ci-dessus et oat permis de choisir deux cosmides (pSPM7 et pSPM5) 
susceptibles de contenir les inserts les plus longs et n'ayant pas de bandes communes. 
Le cosmide pSMP5 hybridait avec la premiere et la deuxieme sonde, mais n'hybridait 

5 pas avec la troisieme sonde, alors que le cosmide pSPM7 hybridait avec la troisieme 
sonde seulement. Ces deux cosmides ont ete sequences en totalite par la technique du 
sequen9age en aveugle (« shotgun sequencing »). Les sequences des inserts de ces deux 
cosmides : pSPM7 et pSPM5 ont pu etre assemblies car bien que ne se chevauchant pas, 
chacun des inserts comprenait une sequence connue a Fune de ses extremites. En effet, 

10 chacun de ces inserts comportait un fragment de la sequence d'un des genes codant une 
enzyme appelee « polyketide synthase » (PKS). Ces 5 genes ont ete clones par Burgett 
S. et al. en 1996 (Brevet americain US 5,945,320) (cf. figure 2). Ainsi, il a pp etre 
. determine une sequence unique d'ADN genomique de S. ambofaciens. Une sequence de 
30943 nucleotides partant, en 5\ d'un site EcoRl situe dans le premier gene PKS et 

15 allant jusqu'a un site BamBI en 3' est presentee en SEQ ID N° 1. Cette sequence 
correspond a la region amont des genes de la PKS (cf. figure 2 et 3). Une deuxieme 
region de 11171 nucleotides, partant d'un site Pstl en 5' et allant jusqu'a un site BstEll 
en V situe dans le cinquieme gene de la PKS est presentee en SEQ ID N° 2. Cette region 
est la region aval des genes de la PKS (Faval et Pamont etant definis par rorientation 

20 des 5 genes de PKS tous orientes dans le meme sens) (cf. figures 2 et 3). 

Dans un troisieme temps et dans le but de doner d'autres genes impliques dans la 
biosynthese des spiramycines, d'autres cosmides comportant des fragments du genome 
de S. ambofaciens dans cette meme region ont ete isoles (cf. exemple 18 et 19). 
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EXEMPLE 1 : Construction d'une banque d'ADN genomique de la souche 
ATCC23877 de Streptomyces ambofaciens chez E. coli 

1.1. Extraction de l'ADN genomique de la souche ATCC23877 de Streptomyces 
ambofaciens. 

5 La souche ATCC23877 de Streptomyces ambofaciens (accessible notamment 

aupres de l'American Type Culture Collection (ATCC) (Manassas, Virginie, USA), sous 
le numero 23877) a ete cultivee en milieu YEME (Yeast Extract-Malt Extract) ((Kieser, 
T, et aL, 2000) et PADN genomique de cette souche a ete extrait et purifie selon les 
techniques standards de lyse et precipitation (Kieser T. et aL, 2000). 

10 1 .2. Construction de la banque d'ADN genomique 

L'ADN genomique de la souche ATCC23877 de Streptomyces ambofaciens tel 
qu'isole ci-dessus a ete digere partiellement par V enzyme de restriction BamHI de 
maniere a obtenir des fragments d'ADN de taille comprise entre environ 35 et 45 kb. 
Ces fragments ont ete clones dans le cosmide pWEDl (Gourmelen et aL, 1998) digere 

15 au prealable par 5amHL Le cosmide pWEDl est derive du cosmide pWE15 (Wahl, et 
aL, 1987) par deletion du fragment Hpal-Hpal de 4.1 kb contenant le module 
d'expression actif chez les mammiferes (Gourmelen et aL, 1998). Le melange de 
ligation a ensuite ete encapside in vitro dans des particules de phages lambda grace au 
systeme «Packagene® Lambda DNA packaging system » commercialise par la societe 

20 Promega en suivant les recommahdatioris du fabfiquant. Les paftictiles phagiques 
obtenues ont ete utilisees pour infecter la souche SURE® d'E. coli commercialisee par 
la societe Stratagene (LaJolla, Califomie, USA). La selection des clones a ete effectuee 
sur milieu LB + ampicilline (50 \ig/ml) puisque le cosmide pWEDl confere la resistance 
aFampicilline. 
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EXEMPLE 2 : Isolement et caracterisation de genes impliques dans la biosynthese 
de spiramycines chez Streptomyces ambofaciens 

2.1 Hybridation sur colonie des clones d'E. coli de la banque genomique de 
Streptomyces ambofaciens ATCC23877 

5 Environ 2000 clones d'E. coli de la banque obtenue ci-dessus, ont ete transferes 

sur filtre pour hybridation sur colonies. La sonde utilisee pour Phybridation est un 
fragment Nael-Nael d'ADN (SEQ ID N° 86) comportant une partie du gene tylB de 
Streptomyces fradiae, Ce fragment correspond aux nucleotides 2663 a 3702 du fragment 
d'ADN decrit par Merson-Davies, L.A. & Cundliffe E. (Merson-Davies, L.A. & 

10 Cundliffe E. 5 1994, numero d'acces GenBank : U08223), dans lequel la sequence 
codante du gene tylB correspond aux nucleotides 2677 a 3843. 

Le fragment Nael-Nael d'ADN portant une partie du gene tylB de Streptomyces 
fradiae (SEQ ID N° 86) a ete marquee au 32 P par la technique du « random priming » 
(Kit commercialise par la societe Roche) et utilise comme sonde pour Phybridation des 

15 2000 clones de la banque, transferes sur filtre. Les membranes utilisees sont des . 
membranes nylon Hybond N commercialisees par la societe Amersham (Amersham 
Biosciences, Orsay, France) et Phybridation a ete effectuee a 55°C dans le tampon decrit' 
par Church & Gilbert (Church & Gilbert, 1984). Un lavage a ete effectue en 2X SSC a 
55°C pendant 15 minutes et deux lavages successifs en 0.5X SSC ont ensuite ete 

20 effectues a 55°C 5 d'une duree de 15 minutes chacun. Dans ces conditions d'hybridation 
et de lavage, 4 clones parmi les 2000 hybrides presentaient un fort signal d'hybridation. 
Ces 4 clones ont ete cultives en milieu LB+ ampicilline (50 (xg/ml) et les 4 cosmides 
correspondants ont ete extraits par lyse alcaline standard (Sambrook et al., 1989). II a 
ensuite ete verifie que Phybridation etait bien due a un fragment d'ADN present dans 

25 Tinsert de ces quatre cosmides. Pour cela, les cosmides ont ete digeres independamment 
par plusieurs enzymes (BamHl, Pstl et Sad), Les produits de digestions ont ete separes 
sur gel d' agarose, transferes sur membrane Nylon et hybrides par le fragment Nael-Nael 
d'ADN comportant une partie du gene tylB de Streptomyces fradiae (cf. ci-dessus) dans 
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les memes conditions que ci-dessus. Les quatres cosmides ont pu etre valides et un de 
ces cosmides a ete plus particulierement retenu et a ete nomme pOS49.i. 



7 2 Verification de re plication de la re gion id entifier et sequenc a ge de 1'insert du 
cosmidepOS49.1 

5 Plusieurs fragments de l'insert du cosmide pOS49.1 ont ete sous-clones et leurs 

sequences ont ete determines. Le cosmide pOS49.1 a ete digere par l'enzyme Sad et il 
a ete montre par Southern blot, dans les conditions decrites precedemment, qu'un 
fragment de 3,3 kb contient la region s'hybridant avec la sonde tylB. Ce fragment de 3,3 
kb a ete isole par electrocution a partir d'un gel d'agarose 0.8% puis clone dans le 
10 vecteur pUC19 (numero d'acces GenBank M77789) et sequence. Le plasmide ainsi 
obtenu a ete nomme pOS49.11. Quatre phases ouvertes de lecture presentant un usage 
des codons typique de Streptomyces ont pu etre identifies dans ce fragment (deux 
completes et deux tronquees), grace au programme FramePlot (Ishikawa J & Hotta K. 
1999). Des comparaisons de sequences grace au programme FASTA (cf.. (Pearson W. R 
15 & D. J. Lipman, 1 988) et (Pearson W. R., 1990), accessible notamment aupres du centre 
de ressources INFOBIOGEN, Evry, France) ont permis de montrer que la proteine 
deduite de l'une de ces 4 phases ouvertes de lecture presente de fortes similitudes de 
sequence avec la proteine TylB (SEQ ID N° 87; Numero d'acces GenBank : U08223) de 
S. fradiae (cf. figure 25). Cette proteine a ete nommee Orf3 (SEQ ID N° 29). 

20 Dans le but de tester si le gene correspondant (le gene orfS (SEQ ID N° 28)) etait 

implique dans la biosynthese des spiramycines chez S. ambofaciens, ce gene a ete 
interrompu par une cassette Ohyg (Blondelet-Rouault M-H. et al,\991, numero d'acces : 
GenBank : X99315). Pour cela, le plasmide pOS49.11 a ete digere par l'enzyme Xhol et 
le fragment contenant les quatre phases ouvertes de lecture (deux completes et deux 

25 tronquees, dont orfl en entier) a ete sous-clone au niveau du site Xhol du vecteur pBC 
SK+ commercialise par la societe Stratagene (LaJolla, Califormie, USA). Le plasmide 
ainsi obtenu a ete nomme pOS49.12. Dans le but d'inactiver orfi, un fragment PmH- 
BstEll interne a orj3 a ete remplace par la cassette Qhyg par clonage bout franc dans ce 
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dernier plasmide. Pour cela, le plasmide pOS49.12 a ete digere par les enzymes Pmli et 
BstETL dont le site unique se trouve dans la sequence codante du gene or/3. Les 
extremites du fragment correspondant au vecteur ont ete rendues bouts francs par un 
traitement- par l'enzyme de Klenow (grand fragment de la DNA polymerase I). La 

5 cassette Qhyg a ete obtenue par digestion par l'enzyme BamRl du plasmide pHP45 
Qhyg (Blondelet-Rouault et al, 1997, numero d'acces GenBank : X99315). Le fragment 
correspondant a la cassette Qhyg a ete recupere sur gel d'agarose et ses extremites ont 
ete rendues bouts francs par un traitement par l'enzyme de Klenow. Les deux fragments 
bouts francs ainsi obtenus (la cassette Qhyg et le plasmide pOS49.12) ont ete ligues et le 

10 produit de ligation a ete utilise pour la transformation de bacteries E. coli. Le plasmide 
ainsi obtenu a ete nomme pOS49.14 et contient le gene or/3 interrompu par la cassette 
Qhyg. 

L'insert du plasmide pOS49.14, sous la forme d'un fragment Xhol-Xhol domt les 
extremites ont ete rendues non cohesives par un traitement par l'enzyme de Klenow, a 

15 ete clone au niveau du site EcoRV du plasmide pOJ260 (le plasmide pOJ260 t :est un ; 
plasmide conjugatif capable de se repliquer chez E. coli mais incapable de se repliquer 
chez 5. ambofaciens (Bierman M et al, 1992). Ce plasmide confere la resistance a 
l'apramycine chez E. coli et Streptomyces). Le plasmide obtenu (insert du plasmide 
pOS49.14 clone dans le plasmide pOJ260) a ete nomme pOS49.16. Ce dernier a ete 

20 transfere dans la souche ATCC23877 de S. ambofaciens par conjugaison a l'aide de la 
souche conjugative E. coli S17-1, comme decrit par Mazodier et al. (Mazodier et al, 
1989). La souche E. coli S17-1 est derivee de la souche E. coli 294 (Simon et al, 1983) 
(Simon, et al, 1986). Des clones transconjugants possedant le marqueur de resistance a 
l'hygromycine porte par la cassette Qhyg et ayant perdu le marqueur de resistance a 

25 l'apramycine porte par le vecteur pOJ260 ont pu etre obtenus. Pour cela, apres 
conjugaison, les clones sont selectionnes pour leur resistance a l'hygromycine. Les 
clones resistants a l'hygromycine sont ensuite repiques respectivement sur milieu avec 
hygromycine (antibiotique B) et sur milieu avec apramycine (antibiotique A) (cf. figure 
9). Les clones resistants a l'hygromycine (HygR.) et sensibles a l'apramycine (ApraS) 
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sont en principe ceux ou un double evenement de recombinaison s'est produit et qui 
possedent done le gene orJ3 interrompu par la cassette Qhyg. Le templacement de la 
copie_sauvage de pr/3 par la copie interrompue a ete verifie par deux hybridations 
successives. Ainsi, l'ADN total des clones obtenus, a ete digere par differentes enzymes, 

5 separe sur gel d' agarose, transfere sur membrane et hybride avec une sonde 
correspondant a la cassette Qhyg (cf. ci-dessus)) pour verifier la presence de la cassette 
dans PADN genomique des clones obtenus. Une deuxieme hybridation a ete effectuee 
en utilisant comme sonde 1' insert Xhol-Xhol du plasmide pOS49.11 contenant les quatre 
phases ouvertes de lecture (deux completes et deux tronquees, dont orf3 en entier). La 

10 verification du genotype peut egalement etre realisee par toute methode connue de 
Thomme du metier et notamment par PCR en utilisant les oligonucleotides appropries et 
sequenpage du produit de PCR. Un des clones orflv. Qhyg ainsi obtenu et dont le 
genotype a ete verifie, a ete choisi et a ete appele OS49.16. 

La production en spiramycine du clone OS49.16 ainsi obtenu a ete testee grace au 
15 test de production decrit plus bas (cf. exemple 15). H a ainsi pu etre demontre que cette 
souche ne produit plus de spiramycine, confirmant Timplication de or/3 et/ou des genes 
situes en aval comme par exemple orf4 dans la biosynthese des spiramycines. 

Une fois cette confirmation obtenue, une plus grande region du cosmide pOS49.1 
a ete sequencee, de part et d'autre du fragment Sad precedemment etudie. Ainsi, a partir 

20 du cosmide pOS49.1, la sequence d'une region comportant sept phases ouvertes de 
lecture entieres et deux autres incompletes, situees de part et d'autre de ces sept phases 
ouvertes completes, a pu etre obtenue. Grace a une recherche dans les bases de donnees, 
il a pu etre montre que Tune des phases ouvertes de lecture incomplete correspondait au 
locus srmG (region codant une enzyme appelee « polyketide synthase » (PKS)). Les 

25 genes correspondants ont ete clones par Burgett S. et al en 1996 (Brevet americain US 
5,945,320). Par ailleurs, les autres phases ouvertes de lecture: les sept ORFs entieres 
nominees : orfl, orf2 y orft, orf4, orf5 ) orf6, or/7 (SEQ ID N° 23, 25, 28, 30, 34, 36 et 
40) et le debut de la huitieme ORF nommee orf8 (la sequence entiere de cette orf est 
donnee en SEQ ED N° 43) n'ont pas ete retrouvees dans les bases de donnees. 
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EXEMPLE 3 : Isolement et caracterisation d'autres genes impliques dans la 
biosynthese de spiramycines chez Streptomyces ambofaciens 

Dans un deuxieme temps et dans le but de cloner d'autres genes impliques dans la 
biosynthese des spiramycines, d'autres cosmides comportant des fragments du genome 
de S. ambofaciens dans cette meme region ont ete isoles. Pour cela il a etc precede a une 
nouvelle serie d'hybridations sur colonies en utilisant trois sondes : 

- La premiere sonde utilisee correspond a un fragment d'ADN BamRl-Pstl de 3,7kb 
contenant un fragment du gene de la PKS (Les genes corresponds a la PKS ont ete 
clones par Burgett S. et al. en 1996 (Brevet americain US 5,945,320)), or/7, or/2 et le 
debut de or/3, sous clone k partir de pOS49.1 et allant d'un site BamHl sitae 1300 paires 
de bases en amont du site EcoRI definissant la position 1 de SEQ ID N° 1, jusqu'au site 
Pstl situe en position 2472 (SEQ ID N° 1). Ce fragment BamHl-Pstl a ete sous clone a 
partir de pOS49.1 dans le plasmide pBC SK+, ce qui a permis d'obtenir le plasmide 
pOS49.28. 

- La deuxieme sonde utilisee correspond a un fragment d'ADN Pstl-BamHl d'environ 
2kb contenant un fragment d>orf7 et d'or/8, sous clone a partir de pOS49.1 et allant d'un 
site Pstl situe en position 6693 de SEQ ID N° 1 jusqu'au site BamHl situe en position 
8714 de SEQ ID N° 1. Ce fragment Pstl-Bamm a ete sous clon6 a partir de pOS49.1 
dans le plamside pBC SK+, ce qui a permis d'obtenir le plasmide pOS49.76. 

- Une troisieme sonde a egalement ete utilisee. Cette derniere correspond a un 
fragment d'ADN de 1.8kb EcoKl-Hindm contenant le gene srmD. Le gene srmD est un 
gene isole de S. ambofaciens Capable de conferer la resistance a la spiramycine. En effet, 
des travaux anterieurs avaient permis le clonage de plusieurs determinants de resistance 
de S. ambofaciens, conferant la resistance a la spiramycine a une souche. de S. 
griseofuscus (souche sensible a la spiramycine) (Pernodet et al., 1993) (Pemodet et al, 
1999). Pour isoler des genes de resistance, unebanque cosmidique de l'ADN genomique 
de la souche S. ambofaciens. ATCC23877 avait ete realisee dans le cosmide pKC505 
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(Richardson MA et al, 1987). Pour cela l'ADN genomique de la souche 5. ambofaciens 
ATCC23877 avait ete digere partiellement par San3Al de maniere a obtenir des 
fragments de taffle comprise entre environ 30 et 40 kb. L'ADN genomique ainsi digere 
(3 jag) avait ete ligue avec lug du pKC505 prealablement digere par.l'enzyme BamHI 
(Pernodet et al, 1999). Le melange de ligation avait ensuite ete encapside in vitro dans 
des particules pbagiques. Les particules phagiques obtenues avaient ete utilisees pour 
infecter la souche d'£. coli HB101 (accessible notamment aupres de rAmerican Type 
Culture Collection (ATCC) (Manassas, Virginie, USA), sous le numero 33694). Environ 
20 000 clones d'£. coli resistant a 1'apramycine avaient ete pooles et les cosmides de ces 
clones avaient ete extraits. Ce pool de cosmides avait ete introduit par transformation de 
protoplastes dans la souche DSM 10191 de S. griseofuscus (Cox KL & Baltz RH. 1984), 
naturellement sensible a la spiramycine (Rao RN et al., 1987, cette souche est disponible 
notamment aupres de la German Collection of Microorganisms and Cell Cultures 
(Deutsche Sammlung von Mikro-organismen und Zellkulturen GmbH, DSMZ), 
(Braunschweig, Allamagne), sous le numero DSM 10191). Les transformants avaient et6 
selectionnes sur un milieu contenant de 1'apramycine. 1300 des clones poussant sur 
milieu contenant de 1'apramycine avaient ete transferes sur milieu contenant 5ug/ml de 
spiramycine. Plusieurs clones resistants a 1'apramycine avaient egalement pousse sur 
milieu contenant de la spiramycine et les cosmides de ces colonies avaient ete extraits et 
utilises pour transformer E. coli et S. griseofuscus (Pemodet et al, 1999). Cinq cosmides 
capables de conferer la resistance a 1'apramycine a E. coli et la co-resistance a 
1'apramycine et la spiramycine chez S. griseofuscus avaient ainsi ete obtenus. Parmi ces 
5 cosmides, il a ete determine qu'un cosmide nomme pOS44.1 possede dans son insert 
un gene (SEQ ID N° 15) qui code une proteine (SEQ ID N° 16) presentant une certaine 
similitude avec une proteine codee par le gene mdmA de Streptomyces mycarofaciens 
(SEQ ID N° 88), ce gene a ete nomme srmD (cf. alignement presente en figure 26 
realise grace au programme FASTA (cf. (Pearson W. R & D. J. Lipman, 1988) et 
(Pearson W. R., 1990), accessibles notamment aupres du centre de ressources 
INFOBIOGEN, Evry, France). 
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Pour isoler le determinant de resistance contenu dans le plasmide pOS44.1, celui- 
ci a ete digere partiellement par 1' enzyme de restriction Sau3Al de maniere a obtenir des 
fragments de taille d'environ 1,5 a 3 kb, ces fragments ont ete ligues dans le vecteur 
pIJ486 linearise par l'enzyme BamEl (Ward et al, 1986). Un plasmide a ete selectionne 

5 pour sa capacite a conferer la resistance a la spiramycine chez la souche DSM 10191 de 
S. griseofuscus (Rao RN et al., 1987), naturellement sensible a la spiramycine (cf. ci- 
dessus). Pour cela, le pool de plasmides correspondant aux fragment Sau3A\ de pOS44.1 
ligues dans le vecteur pIJ486 (cf. ci-dessus), a ete introduit par transformation de 
protoplastes dans la souche DSM 10191 et les transformants ont ete selectionnes pour 

10 leur resistance au thiostrepton (due au gene tsr porte par pIJ486). Les clones poussant 
sur milieu contenant du thiostrepton ont ete transferes sur milieu contenant de la 
spiramycine. Plusieurs clones resistants au thiostrepton ont egalement pousse sur milieu 
contenant de la spiramycine et les plasmides de ces colonies ont ete extraits.^Un 
plasmide conferant la resistance et contenant un insert d'environ 1.8kb a ete selectionne 

15 et nommd pOS44.2. Cet insert de 1 .8kb peut etre sorti facilement grace a un site HindiU 
et un site EcoRl presents dans le vecteur de part et d'autre de l'insert. Cet insert de 1 ,8kb 
Hindlll-Ecom a ete sequence et le gene de resistance qu'il renferme a ete nomme srmD. 
Ce fragment contenant le gene srmD a ainsi pu etre facilement sous-clone dans le 
vecteur pUC19 (numero d'acces GenBank M77789) ouvert par EcoRl-Hindm, le 

20 plasmide obtenu a ete nomme pOS44.4. L'insert de 1.8kb Hindlll-EcoKL, contenant le 
gene srmD, de ce plasmide a ete utilise comme sonde pour localiser les genes de 
biosynthese de spiramycine (cf. ci-dessous). 

Un echantillon d'une souche Escherichia Coli DH5a contenant le plasmide 
pOS44.4 a ete depose aupres de la Collection Nationale de Cultures de Microorganismes _ 
25 (CNCM) Institut Pasteur, 25, rue du Docteur Roux 75724 Paris Cedex 15, France, le 10 
juillet 2002 sous le numero d'enregistrement 1-291 8. 

Environ 2000 clones de la banque, obtenus ci-dessus (cf. exemple 1), ont ete 
transferes sur filtre pour hybridation sur colonies selon les techniques classiques 
(Sambrook a/., 1989). 
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Les trois sondes decrites ci-dessus ont ete marquees an 32 P par la technique du « 
random priming » (Kit commercialise par Roche) et utilisees pour Phybridation des 
2000 clones de la banque, transferees sur filtre. L'hybridation a ete effectuee a 65°C dans 
le tampon decrit par Church & Gilbert (Church & Gilbert, 1984). Un lavage a ete 
effectue en 2X SSC a 65°C pendant 15 minutes et deux lavages successifs ont ensuite 
ete effectues en 0.5X SSC a 65°C, d'une duree de 15 minutes chacun. Dans ces 
conditions d'hybridation et de lavage, 16 clones parmi les 2000 hybrides presentaient un 
fort signal d'hybridation avec au moins une des sondes. Cependant, aucun cosmide 
n'hybridait avec les trois sondes. Les 16 cosmides ont ete extraits et digeres par 
Penzyme de restriction BamHL La comparaison des profils de restriction de ces 
differents cosmides entre eux ? a conduit a choisir deux cosmides susceptibles de contenir 
les inserts les plus longs de la region et n'ayant pas de bandes communes. Ainsi deux 
cosmides Tun nomme pSPM5 et l'autre pSPM7 ont ete choisis. Le cosmide pSPM5 
hybridait avec les sondes orfl a or/4 et la sonde or/8, mais n'hybridait pas avec la sonde 
srmD. pSPM7 hybridait seulement avec la sonde srmD et pas avec les deux autres 
sondes. 

Ces deux cosmides ont ete sequences en totalite par la technique du sequen?age en 
aveugle (« shotgun sequencing »). Les sequences des inserts de ces deux cosmides : 
pSPM7 et pSPM5 ont pu etre assemblies car bien que ne se chevauchant pas, chacun 
des inserts comprenait une sequence connue a Tune de ses extremites. En effet, chacun 
de ces inserts comportait un fragment de la sequence d'un des genes codant une enzyme 
appelee « polyketide synthase » (PKS). Ces 5 genes ont ete clones par Burgett S. et al 
en 1996 (Brevet americain US 5,945,320) (cf. figure 2). Ainsi 5 il a pu etre determine une 
sequence unique d'ADN genomique de S. ambofaciens . Une sequence de 30943 
nucleotides partant en 5' d'un site EcoM situe dans le premier gene PKS et allant 
jusqu'a un site BamYLl en 3 5 est presentee en SEQ ID N° 1. Cette sequence correspond a 
la region amont des genes de la PKS (cf. figure 2 et 3). Une deuxieme region de 1 1 171 
nucleotides, partant d'un site Pstl en 5' et allant jusqu'a un site Ncol en 3* situe dans le 
cinquieme gene de la PKS est presentee en SEQ ID N° 2. Cette deuxieme region est la 
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region aval des genes de la PKS (Taval et P amont etant defini par l'orientation des 5 
genes de PKS tons orientes dans le meme sens) (cf. figure 2 et 3). 

EXEMPLE 4 ; Analyse des sequences nucleotidiques, determination des phases 
ouvertes de lecture et caracterisation des genes ixnpliques dans la biosynthese des 
spiramycines. 

Les sequences obtenues ont ete analysees grace au programme FramePlot 
(Ishikawa J & Hotta K. 1999). Ceci a permis d'identifier, parmi les phases ouvertes de 
lecture, les phases ouvertes de lecture presentant un usage des codons typique de 
Streptomyces. Cette analyse a permis de determiner que cette region comporte 35 ORFs 
localisees de part et d'autre de cinq genes codant l'enzyme «polyketide synthase » 

(PKS). Respectivement 10 et 25 ORFs ont ete identifiees en aval et en amont de ces 

-v. 

genes (l'aval et l'amont etant defini par l'orientation des 5 genes de PKS tous orientes 
dans le meme sens) (cf. figure 3). Ainsi, les 25 phases ouvertes de lecture de ce type, 
occupant une region d'environ 31 kb (SEQ ID N° 1 et figure 3) ont ete identifiees eh 
amont des 5 genes codant la PKS et 10 occupant une region d'environ 11,1 kb (SEQ ID 
N° 2 et figure 3), ont ete identifiees en aval des genes de la PKS. Les genes de la region 
amont ont ete nommes or/7, or/2, or/3, or/4, or/5, orf6, or/7, or/8, orf9c, orflO, orfl 1c, 
or/12, orfl 3c, orfl 4, orfl 5c, orfl 6, orfl 7, orfl 8, orfl 9, orflO, orfllc, orf22c, orf23c, 
orf24c et orf25c (SEQ ID N° 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 
66, 68, 70, 72, 74, 76, 78, 80, 82 et 84). Les genes de la region aval ont ete nommes 
orfl*c, orf2*c, orf3*c, orf4*c, orf5* orfS* orf7*c, orfS* or/9*, orflO* (SEQ ID N° 3, 
5, 7, 9, 11, 13, 15, 17, 19 et 21). Le « c » ajoute dans le nom du gene signifiant pour 
l'ORP en question que la sequence codante est dans l'orientation inverse (le brin codant 
est done le brin complementaire de la sequence donnee en SEQ ID N° 1 ou SEQ ID N° 2 
pour ces genes) (cf. figure 3). 

Les sequences proteiques deduites de ces phases ouvertes de lecture ont ete 
comparees avec celles presentes dans differentes bases de donnees grace a differents 
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programmes : BLAST (Altschul et ah, 1990) (Altschul et al., 1997), CD-search, GOGs 
(Cluster of Orthoiogous Groups) (ces trois programmes sont accessibles notamment 
aupres du National Center for Biotechnology Information (NCBI) (Bethesda, Maryland, 
USA)), FASTA ((Pearson W. R & D. J. Lipman, 1988) et (Pearson W. R., 1990), 
5 BEAUTY (Worley K. C. et aL, 1995)), (ces deux programmes sont accessibles 
notamment aupres du centre de ressources INFOBIOGEN, Evry, France). Ces 
comparaisons ont permis de fonnuler des hypotheses sur la fonction des produits de ces 
genes et d'identifier ceux susceptibles d'etre impliques dans la biosynthese de, 
spiramycine. 

10 EXEMPLE 5 : Inactivation de gene : principe de la construction d'une souche de 
Streptomyces ambofaciens interrompue 

Les methodes utilisees consistent a effectuer un remplacement de gene. Le gene cible 
a interrompre est remplace par une copie de ce gene interrompue par une cassette 
conferant la resistance a un antibiotique (par exemple Papramycine ou Phygromycine), 
15 comme Pillustre la figure 9. Les cassettes utilisees sont bordees de part et d'autre par des 
codons de terminaison de la traduction dans toutes les phases de lecture et par des 
terminateurs de transcription actifs chez Streptomyces. 

^insertion de la. cassette dans le gene cible peut s ! accompagner ou non d ! une deletion 
dans ce gene cible. La taille des regions flanquant la cassette peut aller de quelques 
20 centaines a plusieurs milliers de paires de bases. 

Les constructions necessaires a l'inactivation du gene par la cassette ont ete obtenues ' 
chez E. coli, organisme de reference pour Tobtention de constructions d'ADN 
recombinant. Le gene interrompu a ete obtenu dans un plasmide se repliquant chez E. 
coli mais ne pouvant pas se repliquer chez Streptomyces. 

25 Les constructions ont ensuite ete sous-clonees dans des vecteurs pour permettre la 
transformation et P inactivation du gene voulu chez S. ambofaciens. Pour cela, deux 
plasmides ont ete utilises : 
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- pOJ260 (Bierman M. et al, 1992) (cf. exemple 2) qui confere la resistance a 
l'apramycine chez E. coli et Streptomyces et qui a ete employe quand le gene cible 
a ete interrompu par une cassette conferant la resistance a rhygromycine. 

- pOSKl 205 (4726pb). Ce plasmide derive du plasraide pBK-CMV (commercialise 
5 par la societe Stratagene (LaJolla, Californie, USA)) dans lequel un fragment 

Avrll contenant la sequence codant la resistance a la Neomycine/Kanamycine a 
ete remplace par une sequence codant la resistance a rhygromycine, tout eri 
conservant le promoteur P SV40. Pour cela, le plasmide pHP45-Qhyg (Blondelet- 
Rouault et al, 1997) a ete digere par les enzymes Noil et Pflml et le fragment 

1 o conferant la resistance a l'hygromycine a ete sous-clone au niveau du site Avrll du 

vecteur pBK-CMV apres que toutes les extremites aient ete rendues bout franc 
par traitement a l'enzyme de Klenow. Dans pOSKl 205, la cassette qui confere la 
resistance a l'hygromycine est precedee du promoteur pSV40. Ce plasmide 
confere la resistance a l'hygromycine chez E. coli et Streptomyces eU'a ete 

15 employe quand le gene cible a ete interrompu par une cassette conferant la 

resistance a l'apramycine. 

Les cassettes ont ete introduites dans le gene cible soit par clonage en utilisant des 
sites de restriction presents dans le gene cible, soit par recombinaison entre de courtes 
sequences identiques comme decrit par exemple par Chaveroche et al (Chaveroche MK 
20 etal., 2000). 

Le plasmide portant le gene interrompu par la cassette peut ensuite etre introduit chez 
Streptomyces ambofaciens, par exemple par conjugaison entre E. coli et Streptomyces 
(Mazodier P, et al, 1989). Cette technique a ete utilisee dans le cas ou le vecteur de base 
est le vecteur pOJ260. Une deuxieme technique peut etre utilisee : la technique de la 
25 transformation de protoplastes apres denaturation par traitement alcalin de l'ADN 
(Kieser, T et al., 2000), pour augmenter la frequence de recombinaison comme decrit 
par exemple par Oh & Chater (Oh & Chater, 1997). Cette technique a ete utilisee dans le 
cas ou le vecteur de base est pOJ260 ou pOSKl 205 (cf. ci-dessous). Les transformants 
sont ensuite selectionnes avec I'antibiotique correspondant a la cassette presente dans le 
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gene cible (cf. figure 9, antibiotique B). On selectionne ainsi un melange de clones 
parmi lesquels il y a eu integration par un seul ou par deux evenements de 

recombinaison. Dans un deuxieme . temps on recherche les. clones sensibles a 

Tantibiotique pour lequel le gene de resistance est present dans le vecteur (hors de la 

5 cassette de recombinaison) (cf figure 9, antibiotique A). On peut ainsi selectionner les 
clones pour lesquels il y a eu en principe deux evenements de recombinaison aboutissant 
au remplacement du gene sauvage par la copie interrompue par la cassette. Ces etapes 
sont schematisees figure 9. 

Plusieurs cassettes peuvent etre utilisees pour rinterruption des genes cibles. On peut 
10 par exemple utiliser la cassette Qhyg qui confere la resistance a Thygromycine 
(Blondelet-Rouault et al, 1997, numero d'acces GenBank : X99315). 

EXEMPLE 6 : Construction d'une souche de Streptomyces ambofaciens 
interrompue en phase dans le gene or/3 

15 Le gene orf 3 avait ete interrompu par la cassette Qhyg (cf exemple 2.2) et il a pii 

etre demontre qu'une souche or/3:: Qhyg ne produit plus de spiramycine, confirmant 
Timplication d'un ou plusieurs genes de la region clonee dans la biosynthese des 
spiramycines (cf. exemple 2.2). Au vu de leur orientation, une cotranscription des ORFs 
1 a 7 est probable (cf figure 3) et le phenotype observe (non producteur de 

20 spiramycines) peut etre du a Finactivation d'un ou plusieurs des genes co-transcrits avec 
or/3. Pour confirmer Timplication de or/3 dans la biosynthese de spiramycines, une 
nouvelle inactivation du gene or/3 a ete effectuee, cette derniere etant realisee en phase. : 
Pour cela, un fragment Dralll interne a or/3 de 504 paires de bases a ete delete. Un 
fragment d'ADN obtenu a partir de pOS49.1 ? allant du site EcoRl situe en position 1 

25 (SEQ ID N° 1) jusqu'au site Sad situe en position 5274 (SEQ ID N° 1) et qui comporte 
une deletion entre les deux sites Dralll aux positions 2563 et 3067 (504 nucleotides 
retires) a ete clone dans le plasmide pOJ260 (Bierman M. et al., 1992). Le plasmide 
ainsi obtenu a ete nomme pOS49.67. 
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L'insert de pOS49.67 est done constitue par un fragment d'ADN de S. ambofaciens 
contenant les genes orfl, or/2, or/3 avec la deletion en phase, or/4 et une partie de orf5. 
Le vecteur dans lequel cet insert a ete sons-clone est pOJ260, le plasmide pOS49.67 
confere done la resistance a l'apramycine et a ete introduit par transformation de 

5 protoplastes dans la souche OS49. 1 6 (cf. exemple 2). La souche OS49.16 etant resistante 
a l'hygromycine, des transformants hygR et apraR ont ete obtenus. Apres deux passages 
de tels clones sur milieu non selectif, les clones sensibles a l'apramycine et a 
l'hygromycine (apraS et hygS) ont ete recherches. Dans certains de ces clones, on 
s'attend en effet a ce qu'un evenement de recombinaison entre sequences homologues 

10 conduise au remplacement de la copie de or/3 interrompue par la cassette Qhyg (contenu 
dans le genome de la souche OS49.16) par la copie de or/3 avec la deletion en phase 
presente sur le vecteur. Les clones resultant de cette recombinaison sont attendus comme 
apraS et hygS apres I'elimination des sequences du vecteur. Le genotype des souches 
ainsi obtenues peut etre verifie par hybridation ou par PCR et sequencage du produit de 

15 PCR (pour verifier que seule une copie de or/3 deletee en phase est presente dans le 
genome des clones obtenus). Des clones n'ayant que la copie de or/3 avec une deletion 
en phase ont ainsi ete obtenus et leur genotype a ete verifie. Un clone presentant les 
caracteristiques recherchees a ete plus particulierement selectionne et a ete nomine 
OS49.67. 

20 Un echantillon de la souche OS49.67 a ete depose aupres de la Collection 1 

Nationale de Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur 
Roux 75724 Paris Cedex 1 5, France, le 10 juillet 2002 sous le numero d'enregistrement 
1-2916. 

25 EXEMPLE 7 : Construction d'une souche de Streptomyces ambofaciens 
interrompue dans le gene or/8 

Pour realiser l'inactivation du gene or/8, une construction dans laquelle la cassette 
Qhyg a ete introduite dans la sequence codante de or/8 a ete obtenue. Pour cela, le 
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plasmide pOS49.88 a tout d'abord ete construit. Le plastnide pOS49.88 est derive du 
plasmide pUC19 (numero d'acces GenBank M77789) par insertion d'un fragment de 3.7 
kb (fragment Pstl-EcoRI obtenu a partir du cosmide pSPM5), contenant la fin de or/7, 
or/8 et le debut de or/9, clone dans les sites Pstl-EcoBl de pUC19. La cassette Qhyg 
5 (sous forme d'un fragment BamHl, rendu bout franc par traitement a l'enzyme de 
Klenow) a ete clonee au niveau du site unique Sail de pOS49.88 situe dans or/8 apres 
que toutes les extremites aient ete rendues bout franc par traitement a l'enzyme de 
Klenow. 

Le clonage etant bout franc, deux types de plasmides ont ete obtenus selon le sens 
10 d'insertion de la cassette : pOS49.106 dans lequel les genes hyg et or/8 sont dans la 
meme orientation et pOS49.120 dans lequel les genes hyg et or/8 sont dans des 
orientations opposees. L'insert du plasmide pOS49.106 a ensuite ete sous-clone dans le 
plasmide pOJ260 pour donner pOS49.107. Pour cela, le plasmide pOS49.106 a ete 
digere par l'en2yme^Lsp718I et les extremites ont ete rendues bout franc par traitement a 
15 l'enzyme de Klenow, ce produit de digestion a ete redigere par l'enzyme Pstl et le 
fragment contenant le gene or/8 dans lequel la cassette Qhyg a ete inseree, a ete clone 
dans le vecteur pOJ260 (cf. ci dessus). Pour cela, le vecteur pOJ260 a ete digere par les 
enzymes EcoRV et Pstl et utilise pour la ligation. Cette manipulation permet done 
d'obtenir une ligation orientee puisque chacun des deux fragments est bout franc d'un 
20 cote et Pstl de l'autre. Le plasmide obtenu a ete nomme pOS49.1 07. 

Le plasmide pOS49.107 a ete introduit dans la souche ATCC23877 de S. 
ambo/aciens par transformation de protoplastes (Kieser, T et al, 2000). Apres 
transformation des protoplastes, les clones sont selectionnes pour leur resistance a 
l'hygromycine. Les clones resistants a Thygromycine sont ensuite repiques 
25 respectivement sur milieu avec hygromycine (antibiotique B) et sur milieu avec 
apramycine (antibiotique A) (cf. figure 9). Les clones resistants a rhygromycine (HygR) 
et sensibles a l'apramycine (ApraS) sont en principe ceux ou un double evenement de 
crossing over s'est produit et qui possedent le gene or/8 interrompu par la cassette Qhyg. 
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Le remplacement de la copie sauvage de orf8 par la copie interrompue par la cassette 
Qhyg a ete verifie par Southern Blot. Ainsi, l'ADN total des clones obtenus, a ete digere 
par plusieurs enzymes, separe sur gel d' agarose, transfere sur membrane et hybride avec 
une sonde correspondant a la cassette Qhyg pour verifier la presence de la cassette dans 
5 l'ADN genomique des clones obtenus. Une deuxieme hybridation a ete effectuee en 
utilisant comme sonde 1' insert Pstl-EcoRI contenant la fin de or/7, or/8 et le debut de 
or/9 d'une taille d'environ 3,7 kb du plasmide pOS49.88. La verification du genotype 
peut etre realisee par toute methode connue de l'homme du metier et notamment par 
PCR en utilisant les oligonucleotides appropries et sequen9age du produit de PCR. 

10 Un clone orf8\:Qhyg a ete choisi et nomine OS49.107. Un echantillon de la souche 

OS49.107 a ete depose aupres de la Collection Nationale de Cultures de 
Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur Roux 75724 Paris Cedex 
15, France, le 10 juillet 2002 sous le numero d'enregistrement 1-2917. 

15 EXEMPLE 8 : Construction d'une souche de Streptomyces ambofaciens 
interrompue dans le gene orflO 

Un fragment d f ADN de 1,5 kb interne au gene orflO a ete obtenu par PCR en 
utilisant comme matrice, l'ADN genomique de & ambofaciens et les amorces suivantes : 

SRMRl : 5' CTGCCAGTCCTCTCCCAGCAGTACG 3' (SEQ ID N° 89) 
20 SRMR2 : 5' TGAAGCTGGACGTCTCCTACGTCGG 3' (SEQ ID N° 90) 

Ce fragment d'ADN issu de la PCR a ete clone dans le vecteur pCR2.1 commercialise 
par la societe Invitrogen (Carlsbad, Californie, USA). Le plasmide ainsi obtenu a ete 
nomme pOS49.32. La cassette Qhyg (sous forme d ? un fragment BamHI, cf. ci-dessus) a 
ete clonee au niveau du site unique BstEll interne au fragment du gene orfl 0, apres que 
25 toutes les extremites aient ete rendues bout franc par traitement a Tenzyme de Klenow. 
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Le clonage etant bout franc, deux types de plasmides ont ete obtenus selon le sens 
d'insertion de la cassette : pOS49.43 dans lequel les genes hyg et orflO sont dans la 
meme orientation et pQS_49. 44 dans lequel les genes hyg et orflO sont dans des 
orientations opposees. L'insert du plasmide pOS49.43 a ete transfere (sous forme d'un 
fragment AsplUl-Xbal dont les extremites ont ete rendues bout franc par traitement a 
l'enzyme de Klenow) dans le site EcoRW du plasmide pOJ260 ce qui a permis d'obtenir 
le plasmide pOS49.50. Le plasmide pOS49.50 contenant le fragment du gene orflO 
interrompu par la cassette Qhyg a ete introduit dans la souche ATCC23877 de 
Streptomyces ambofaciens. Apres transformation, les clones sont selectionnes pour leur 
resistance a l'hygromycine. Les clones resistants a l'hygromycine sont ensuite repiques 
respectivement sur milieu avec hygromycine (antibiotique B) et sur milieu avec 
apramycine (antibiotique A) (cf. figure 9). Les clones resistants a l'hygromycine (HygR) 
et sensibles a l'apramycine (ApraS) sont en principe ceux ou un double evenement de 
crossing over s'est produit et qui possedent le gene orflO interrompu par la cassette 
Qhyg. Des clones qui possedaient le marqueur de resistance a l'hygromycine porte par la 
cassette et qui avaient perdu le marqueur de resistance a l'apramycine porte par le 
vecteur pOJ260 ont ainsi ete obtenus. L'evenement de remplacement de la copie sauvage 
de orflO par la copie interrompue orflOv.Qhyg a ete verifie par Southern Blot. Ainsi, 
l'ADN genomique total des clones obtenus, a ete digere par plusieurs enzymes, separe 
sur gel d'agarose, transfere sur membrane et hybride avec une sonde corresponds a la 
cassette Qhyg pour verifier la presence de la cassette dans l'ADN genomique des clones 
obtenus. Une deuxieme hybridation a ete effectuee en utilisant comme sonde le produit 
PGR de 1 ,5 kb interne au gene orflO (cf. ci-dessus). 

Un clone presentant les caracteristiques attendues (orflO::Qhyg) a ete plus 
particulierement selectionne et nomme OS49.50. II a pu en effet etre verifie grace aux 
deux hybridations que la cassette Qhyg etait bien presente dans le genome de ce clone et 
que l'on obtient bien le profil de digestion attendu dans le cas d'un remplacement, a la 
suite d'un double evenement de recombinaison, du gene sauvage par la copie 
interrompue par la cassette Qhyg dans le genome de ce clone. La verification du 
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genotype peut egalement etre realisee par toute methode connue de rhomme du metier 
et notamment par PCR en utilisant les oligonucleotides appropries et sequen9age du 
produit de PCR. 



5 EXEMPLE 9 : Inactivation de genes : principe de la construction d'une souche de 
Streptomyces ambofaciens interrompue selon la technique des « cassettes 
excisables » (cf Figure 9 et 10) 

Un deuxieme type de cassettes peut etre utilise pour 1' inactivation de genes : les 
10 cassettes dites « cassettes excisables ». Ces cassettes presentent Tavantage de pouvoir. 
etre excisees chez Streptomyces par un evenement de recombinaison specifique de site 
apres avoir ete introduites dans le genome de S. ambofaciens. Le but est d'inactiver 
certains genes dans des souches de Streptomyces sans laisser dans la souche finale de. 
marqueurs de selection ou de grandes sequences d'ADN n'appartenant pas a la souche* 
15 Apres excision il subsiste uniquement une courte sequence d'environ une trentaine de 
paires de bases (appele site « cicatriciel ») dans le genome de la souche (cf. figure 10). 

La mise en oeuvre de ce systeme consiste, dans un premier temps, au remplacement 
de la copie sauvage du gene cible (grace a deux evenements de recombinaison 
homologue, cf. figure 9) par une construction dans laquelle une cassette excisable a ete 

20 inseree dans ce gene cible. L'insertion de cette cassette est accompagnee d'une deletion ! 
dans le gene cible (cf figure 9). Dans un deuxieme temps, Pexcision de la cassette 
excisable du genome de la souche est provoquee. La cassette excisable fonctionne grace .. 
a un systeme de recombinaison specifique de site et a pour avantage de perrnettr'e 
Pobtention de mutants de Streptomyces ne portant finalement pas de gene de resistance. 

25 On s'affranchit egalement d'eventuels effets polaires sur l'expression des genes situes en 
aval, du ou des genes inactives (cf. figure 10). 
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L'ernploi de cassettes excisables a ete decrit et utilise chez de nombreux organismes 
dont les cellules de mammifere, de levures et chez E. coli (Bayley et aL 9 1992 ; Brunelli 
et Pall, 1993 ; Camilli et al. y 1994 ; Dale et Ow 5 1991 ; Russell et aL, 1992; Lakso et al, 
1992). Ces cassettes excisables utilisent toutes la recombinase specifique de site Cre 
agissant sur les sites lox. Ce systeme de recombinaison provient du bacteriophage PL 

Pour la construction d'un systeme de type « cassette excisable » chez Streptomyces ^ il 
a ete tire partie du systeme de recombinaison specifique de site decrit pour V element 
genetique mobile pSAM2 de Streptomyces ambofaciens (Boccard et aL, 1989a et b). Le 
systeme mis en place consiste dans un premier temps a construire un vecteur 
recombinant comportant le gene a interrompre dans lequel est inseree une cassette 
excisable. L'insertion dans le gene cible de la cassette excisable s'accompagne d'une 
deletion dans le gene cible. Elle peut etre realisee par clonage en utilisant des sites de 
restriction presents dans le gene cible ou par recombinaison entre de courtes sequences 
identiques comme decrit par exemple par Chaveroche et al (Chaveroche MK et al., 
2000). La cassette excisable peut etre construite en utilisant par exemple la cassette 
Qhyg (Blondelet Rouault et al, 1997). Cette cassette a ete bordee par des sequences attR 
et attL qui flanquent normalement la copie integree de pSAM2 (cf. figure 15). Les 
sequences attL et attR contiennent tous les sites necessaires a la recombinaison site- 
specifique permettant Texcision de pSAM2 ou de tout fragment d'ADN situe entre ces ; 
deux regions (Sezonov et al, 1997, Raynal et al, 1998). La construction d'une telle 
cassette n'est evidemment pas limitee a l'utilisation d'une cassette Qhyg, mais d'autres 
cassettes de resistances peuvent servir de base a la construction de cette cassettte (par 
exemple la cassette Qaac ou Qvph (Blondelet Rouault et al, 1997)). 

Apres Tobtention de cette construction, la souche de Streptomyces est transformee 
avec le plasmide recombinant.- Les transformants sont ensuite selectionnes avec 
1'antibiotique correspondant a la cassette presente dans le gene cible (cf. figure 9, 
antibiotique B ? il s'agit par exemple d'une selection par Thygromycine si la cassette 
excisable derive de la cassette Qhyg). On selectionne ainsi un melange de clones parmi 
lesquels il y a eu integration par un seul ou par deux evenements de recombinaison. 
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Dans un deuxieme temps on recherche les clones sensibles a Tantibiotique pour lesquels 
le gene de resistance est present dans le vecteur (hors de la cassette de recombinaison) 
(cf. figure 9, antibiotique A). On peut ainsi selectionner les clones pour lesquel il y a eu 
en principe deux evenements de recombinaison aboutissant au remplacement du gene 
5 sauvage par la copie interrompue par la cassette. Ces etapes sont schematises figure 9, 
le genotype des clones ainsi obtenus est verifie par Southern blot et une souche 
presentant les caracteristiques voulues (le remplacement du gene sauvage par la copie 
interrompue par la cassette excisable) est selectionnee. 

Dans un deuxieme temps, la souche selectionnee ci-dessus, est transformee par un 
10 plasmide permettant l'expression des genes xis et int qui sont tous deux necessaires a la 
recombinaison specifique de site entre les sites attR et attL. Cette recombinaison 
entraine le depart de la cassette excisable du genome de la souche, grace a un evenement 
. de recombinaison (cf. figure 10) (Raynal et ah, 1998). II est interessant de choisirle 
vecteur portant les genes xis et int parmi les vecteurs relativement instables chez 
15 Streptomyces (par exemple derive du vecteur Streptomyces pWHM3, (Vara et qi., 
1989)) ; ceci permet d'obtenir une souche ayant perdu ce dernier vecteur apres quelques 
cycles de sporulation en absence de pression de selection. 

Pour exciser la cassette, on peut par exemple utiliser le plasmide pOSV508 (cf. figure 
14) qui est introduit par transformation de protoplastes dans la souche de S, ambofaciens 

20 contenant un gene interrompu par la cassette excisable. Le plasmide pOSV508 est derive 
du plasmide pWHM3 (Vara J et a/.,1989) (cf. figure 13) dans lequel ont ete ajoutes les 
genes xis et int de pSAM2 (Boccard F. et ah, 1989b) places sous le controle du 
promoteur ptrc (Amann, E. et ah, 1988). Les genes xis et int places sous ie controle du 
promo teur ptrc ont ete sous clones dans le plasmide pWHM3 a partir du plasmide 

25 pOSint3 (Raynal et ah, 1998) (cf. figure 14). L' introduction dans la souche mutante du 
plasmide pOSV508 portant les genes xis et int de pSAM2 va permettre l'excision 
efficace par recombinaison specifique de site de la cassette excisable entre les sites attL 
et attR flanquant cette cassette (Raynal A. et ah, 1998) (figure 10). Parmi les 
transformants, selectionnes pour leur resistance au thiostrepton due au gene tsr porte par 
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pOSV508, on choisit ceux devenus sensibles a Fantibiotique auquel la presence de la 
cassette confere la resistance (cf. figure 10). L'excision est efficace et.il a ete observe 
que plus de 90% des transformants sont de ce type. Apres un ou plusieurs cycles de 
croissance et sporulation sur un milieu solide depourvu de thiostrepton, on obtient des 
5 clones ayant perdu le plasmide pOSV508. Ces clones sont reperables par leur sensibilite 
au thiostrepton. La sequence du gene cible delete peut etre verifiee par PCR et 
sequen?age du produit PCR. 

Finalement, la souche resultante porte au niveau du gene inactive (deletion interne 
par exemple) un site att « cicatriciel » correspondant au site attB minimal (Raynal et al, 
. 10. 1998), issu de la recombinaison entre les sites attR et attL. Ce site attB minimal qui 
subsiste est semblable a celui present naturellement dans les souches de Streptomyces 
ambofaciens, Streptomyces pristinaespiralis et Streptomyces lividans (Sezonov et ah, 
1997). 

Le gene que Ton veut inactiver peut etre cotranscrit avec d'autres genes situes en . 

15 aval. Pour eviter que l'rnactivation d'un des genes ait un effet polaire sur P expression 1 ; 
des genes en aval dans Poperon, il est important d'obtenir une deletion en phase apres 
excision de la cassette. Le systeme des cassettes excisables tel que decrit ci-dessus 
permet de repondre a une telle exigence. L'homme du metier pourra, en effet, aisement 
construire trois cassettes excisables distinctes, celles-ci laissant apres excision une 

20 sequence de 33 , 34 ou 35 nucleotides respectivement, sans codon stop quelle que soit la 
phase de lecture. Connaissant la sequence du gene cible et la taille de la deletion ; 
associee a Tinsertion de la cassette, il est possible de choisir entre ces trois cassettes 
excisables de fa<?on a ce que Pexcision conduise a une deletion en phase. Sur les 33, 34 
on 35 nucleotides rajoutes, 26 correspondent a la sequence attB minimale (cf. figure 27). 

25 Dans le cas de la presente demande, deux cassettes excisables ont ete utilisees. Ces 

deux cassettes sont les suivantes : attlQhyg+ (SEQ ID N° 91) et att3Qaac- (SEQ ID N° 
92), ces cassette laissent respectivement 33 et 35 nucleotides apres excision. Elles 
comportent respectivement la cassette Qhyg ou la cassette Qaac, les signes + et - 
correspondant a Porientation de la cassette de resistance. Ces deux cassettes ont ete 
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construites et clonees au niveau du site EcoKV du vecteur pBC SK+ dont le site HindTR 
a ete suprime au prealable. Les plasraides obtenus ont ete nommes pattlHhyg-h et 
patt3Qaac- respectivement. Les cassettes excisables peuvent etre facilement sorties par 
une digestion du plasmide par EcoRV. 

5 

EXEMFLE 10 : Construction d'une souche de Streptdmyces ambofaciens 
interrompue dans le gene orf2 

L'inactivation du gene or/2 a ete realisee grace a la teclinique des cassettes 
excisables (cf. ci-dessus). La souche de depart utilisee est la souche Streptomyces 

10 ambofaciens OSC2 qui derive de la souche ATCC23877. Cependant, la souche OSC2 ; 

" *** 

differe de la souche ATCC23877 en ce qu'elle a perdu l'element genetique mobile 
pSAM2 (Boccard et aL, 1989a et b). Cet element mobile peut etre perdu de maniere 
spontanee au cours de la protoplastisation (action du lysozyme pour digerer la paroi 
bacterienne et fragmenter le mycelium (Kieser et al, 2000)) et de la regeneration des 

15 protoplastes de la souche ATCC23877. Pour selectionner les clones ayant perdu 
P element pSAM2 3 il a ete mis en place un crible, base sur la repression du gene pra par 
le represseur de transcription KorSA (Sezonov et ah, 1995) (Sezonov G. et aL y 2000), 
Pour cela, un fragment d'ADN contenant le promoteur du gene pra place en amont du 
gene aph (conferant la resistance a la kanamycine et depourvu de son propre promoteur) 

20 a ete clone dans le vecteur instable pWHM3Hyg, ce dernier derivant du plasmide 
pWHM3 (Vara et al., 1989) dans lequel le gene tsr a ete remplace par le gene hyg 
(conferant la resistance a Phygromycine). Le plasmide ainsi obtenu a ete nomme 
pOSV510. La souche ATCC23877 a ete ti*ansformee apres protoplastisation par le* 
plasmide pOSV510. Le promoteur Pra est un promoteur reprime par le represseur 

25 KorSA, le gene codant ce dernier etant situe au sein de l'element mobile pSAM2 
(Sezonov G. et al, 2000). Apres transfonnation par le plasmide pOSV510 5 les bacteries 
transformees sont selectionnees pour leur resistance a la kanamycine (due au gene aph 
porte par pOSV510). Les clones ayant perdu Pelement integratif pSAM2 ont perdu le 
represseur KorSA et le promoteur Pra n'est done plus reprime et permet P expression du 
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gene de resistance a la kanamycine aph. Une selection par la kanamycine apres 
transformation par le plasmide pOSV510 permet done de selectionner les clones ayant 
perdu relement integratif pSAM2 (et done KorSA) et possedant le plasmide pOSV510. 
Le plasmide pOSV510 etant instable, apres quelques cycles de sporulation sans 
antibiotique, des clones isoles sont repiques sur milieu avec kanamycine, sur milieu avec 
hygromycine et sur milieu sans antibiotique. Les clones sensibles a la kanamycine et a 
Thygromycine ont perdu pOSV510. La perte de P element pSAM2 a ete verifiee par 
hybridation et PCR. Un clone presentant les caracteristiques souhaitees a ete selectionne 
et a ete nomine OSC2. 

Un echantillon de la souche OSC2 a ete depose aupres de la Collection Nationale 
de Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur Roux 
75724 Paris Cedex 15, France, le 10 juiliet 2002 sous le numero d'enregistrement I- 
2908. 

L'inactivation du gene orf2 a ete realisee grace a la technique des cassettes ;: 
excisables (cf. ci-dessus et figure 10). Pour cela, un insert de 4,5 kb dont la sequence 
part du site EcoRl sitae en position 1 jusqu'au site BamHl sitae en position 4521 (SEQ 
ID N° 1) a ete sous-clone au niveau des sites EcoRI et BarnHI du plasmide pUC19 
(numero d'acces GenBank M77789) a partir du cosmide pSPM5. Le plasmide ainsi 
obtenu a ete nomme pOS49. 99. 

Ce plasmide a ete introduit dans la souche E. coli KS272 qui contenait deja le 
plasmide pKOBEG (Chaveroche et al, 2000) (cf. figure 12). 

En parallele, la cassette excisable attSQaac- (SEQ ID N° 92, cf. ci dessus) a etc 
amplifiee par PCR en utilisant comme matrice le plasmide pOSK1102 (Le plasmide 
pOSK1102 est un plasmide derive du vecteur pGP704Not (Chaveroche et aL, 2000) 
(Miller VL & Mekalanos JJ, 1988) dans lequel la cassette attSQaac- a ete clonee comme 
un fragment EcoRV dans le site unique EcoRV de pGP704Not) et a Faide des amorces 
suivantes : 
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ORF2A 

5 ' CCCGCGCGGCAGCCTCTCCGTGATCGAGTCCGGCGTGACCATCGCGCGCGCTTCGTTCGG-3 ' (SEQ 

ID N° 93) 
ORF2B 

5' GCTCCGTGCGTCATGCAGGAAGGTGTCGTAGTCGCGGTAGATCTGCCTCTTCGTCCCGAA-3 ' (SEQ 
ID N° 94) 

Les 40 deoxy-nucleotides situes a l*extremite 5' de ces oligonucleotides 
comportent une sequence correspondant a une sequence dans le gene cible {orf2 dans le 
cas present) et les 20 deoxy-nucleotides situes le plus en 3' (figure en gras ci-dessus) 
correspondent a la sequence d'une des extremites de la cassette excisable att3Qaac- (cf. 
figure 11). 

Le produit de PCR ainsi obtenu a ete utilise pour transformer la souche E. coli contenant 
les plasmides pKOBEG et pOS49.99 comme decrit (Chaveroche et al, 2000) (cf. figure : 
12). Ainsi, les bacteries ont ete transformees par electroporation et selectionnees pour 
leur resistance a l'apramycine. Les plasmides des clones obtenus ont ete extraits^et 
digeres par plusieurs enzymes de restriction, dans le but de verifier que le profil de 
digestion obtenu correspond au profil attendu s'il y a eu insertion de la cassette 
(att3Qaac-) dans le gene cible (or/2), c'est a dire si il y a bien eu recombinaison 
homologue entre les extremites du produit PCR et le gene cible (Chaveroche et al.- 
2000). La verification de la construction peut egalement etre realisee par toute mefhode ' 
connue de l'homme du metier et notamment par PCR en utilisant les oligonucleotides ; 
appropries et sequencage du produit de PCR. Un clone dont le plasmide possede le 
profil attendu a ete selectionne et le plasmide correspondant a ete nomme pSPM17. Ce 
plasmide derive de pOS49.99 dans lequel or/2 est interrompue par la cassette 
apramycine (cf. figure 12). 

L'insertion de la cassette s'accompagne d'une deletion dans or/2, entre les nucleotides 
21 1 et 492 de la partie codante de or/2. 

Le plasmide pSPM17 a ete digere par l'enzyme EcoRl puis les extremites ont ete 
rendues bout franc par traitement a l'enzyme de Klenow, ce produit de digestion a ete 
ensuite digere par l'enzyme Xbal et l'insert contenant le gene or/2 delete a ete clone 
dans le vecteur pOSK1205 (cf. ci dessus). Pour cela, le vecteur pOSK1205 a ete digere 
par P enzyme BamHl puis les extremites ont ete rendues bout franc par traitement a 
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renzyme de Klenow, ce produit a ete ensuite digere par 1* enzyme Xbal, et utilise pour la 
ligation avec Pinsert obtenu a partir de pSPM17 corame ci-dessus. Cette manipulation 
permet done d'obtenir une ligation orientee puisque chacun des deux fragments est bout 
franc d'un cote et Xbal de r autre. Le plasmide ainsi obtenu a ete nomme pSPM21 3 il 
porte un gene de resistance a lTiygromycine (partie vecteur) et un insert dans lequel le 
gene or/2 delete est remplace par la cassette att3Qaac-. 

Le vecteur pSPM21 a ete introduit dans la souche Streptomyces ambofaciens OSC2 
(cf ci dessus) par transformation de protoplastes (Kieser, T et al, 2000). Apr£s 
transformation, les clones sont selectionnes pour leur resistance a rapramycine Les 
clones resistants a Papramycine sont ensuite repiques respectivement sur milieu avec 
apramyeme (antibiotique B) et sur milieu avec hygromycine (antibiotique A) (cf. figure 
9). Les clones resistants a rapramycine (ApraR) et sensibles a rhygromycine (HygS) 
sont en principe ceux ou un double evenement de crossing over s'est produit et qui 
possedent le gene or/2 interrompu par la cassette att3Qaac-. Ces clones ont ete 
selectionnes et le remplacement de la copie sauvage de or/2 par la copie interrompue par 
la cassette a ete verifie. La presence de la cassette attSQaac- a ete verifiee par PCR suf 
colonic Une hybridation a egalement ete effectuee. Pour cela, l'ADN total des clones 
obtenus, a ete digere par plusieurs enzymes, separe sur gel d'agarose, transfere sur 
membrane et hybride avec une sonde de 3 kb correspondant a un fragment ^coRl- 
BamHI de P insert du plasmide pOS49.99 (cf. ci-dessus). La verification du genotype 
peut egalement etre realisee par toute methode connue de Phomme du metier et 
notamment par PCR en utilisant les oligonucleotides appropries et sequen^age du 
produit de PCR. 

Un clone presentant les caracteristiques attendues a ete selectionne et nomme 
SPM2L II a pu etre verifie grace a -la PCR et a 1 'hybridation que la cassette attSQaac- . 
etait bien presente dans le genome de ce clone et que Pon obtient bien le profil de 
digestion attendu dans le cas d'un remplacement, a la suite d'un double evenement de 
recombinaison, du gene sauvage par la copie interrompue par la cassette att3Qaac- dans 
le genome de ce clone. Ce clone possede done le genotype : orf2::att3Qaac-. 
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Un echantillon de la souche SPM21 a ete depose aupres de la Collection Nationale 
de Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur Roux 
75724 Paris Cedex 15, France, le 10 juillet 2002 sous le numero d'enregistrement I- 
2914. 

5 La souche SPM21 a ete transformee par le vecteur pOSV508 par transformation de 

protoplastes pour provoquer l'excision de la cassette (cf. figure 14). Le plasmide 
pOSV508 est deriv6 du plasmide pWHM3 (Vara J et a/.,1989) (cf. figure 13) dans 
lequel il a ete ajoute les genes xis et int de pSAM2 (Boccard F. et al, 1989b) place sous 
le controle du promoteur ptrc (Amann, E. et al, 1988) (cf. figure 14). L'introductiori 

10 dans la souche SPM21 du plasmide pOSV508 portant les genes xis et int de pSAM2 
permet l'excision efficace par recombinaison specifique de site de la cassette excisable 
entre les sites attL et attR flanquant cette cassette (Raynal A. et al, 1998) (figure 10). 
Parmi les transformants selectionnes pour leur resistance au thiostrepton due au gene tsr 
porte par pOSV508, on choisit ceux devenus sensibles a l'apramycine dont le geSie de 

15 resistance est porte par la cassette attiQaac-, l'excision entraine en effet la perte de ce : 
gene de resistance (cf. figure 10). Le plasmide pOSV508 est instable et apres deux 
passages successifs sur milieu sans antibiotique des clones isoles sont repiques sur 
milieu avec thiostrepton et sur milieu sans thiostrepton. Les clones sensibles au 
thiostrepton ont perdu pOSV508. II a ete verifie que l'excision de la cassette aboutit bien 

20 a une deletion en phase dans le gene orf2 par PCR et sequen<?age du produit PCR, 
l'excision de la cassette laisse en effet une sequence « cicatricielle » att3 caracteristique 
(qui est similaire au site attB d'origine apres recombinaison entre les sites attL et attR) : 

5' ATCGCGCGCGCTTCGTTCGGGACGAAGAGGTAGAT 3' (SEQ ID N° 95). 

La souche ainsi obtenue et possedant le genotype voulu {orf2::att3) a ete nominee 
25 SPM22. 

Un echantillon de la souche SPM22 a ete depose aupres de la Collection Nationale 
de Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur Roux 
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75724 Paris Cedex 15, France, le 10 juillet 2002 sous le numero d'enregistrement I- 
2915. 



EXEMPLE 11 : Construction d'une souche de Streptomyces ambofaciens 
interrompue dans le gene orfl2 

Pour l'inactivation de or/72, orf!3c et orf!4 un meme plasmide de depart 
(pSPM504) a ete employe pour introduire a differentes positions une cassette de type 
« cassette excisable ». Ce plasmide possede un insert de 15,1 kb qui correspond a la 
region de or/7 a or/17. Pour construire ce plasmide un fragment Bglil de 15,1 kb 
provenant de la digestion du cosmide pSPM7 (cf. ci-dessus) a ete clone dans le plasmide 
pMBL18 (Nakano et al, 1995) digere par BamUI. Les extremites BamRl et BglR etant 
compatibles, on obtient apres ligation, le plasmide pSPM502. La totalite de l'insert de 
pSPM502 a ensuite ete sous-clone (sous forme d'un fragment HindOUNheX) dans le 
plasmide pOSK1205 (digere par HindlWNheT) ce qui a permis d'obtenir le plasmide 
pSPM504. 

Ce plasmide a ete introduit dans la souche E. coli KS272 qui contenait deja le 
plasmide pKOBEG (Chaveroche et al., 2000) (cf. figure 12). 

En parallele, la cassette excisable att3Qaac- a ete amplifiee par PCR en utilisant 
comme matrice le plasmide pO SKI 102 (le plasmide pOSKl 102 est un plasmide derive 
du vecteur pGP704Not (Chaveroche et al., 2000) (Miller VL & Mekalanos JJ, 1988) 
dans lequel la cassette att3Qaac- a ete clonee comme un fragment EcoRV dans le site 
unique EcoRV de pGP704Not), les amorces utilisees sont les suivantes : 

EDR8 : 5 ' CGGGATGATCGCTTGTCCGGCGGCCGGATGCCTAGCCTCATCGCGCGCGCTTCGTTCGG 3 ' 
(SEQ ID N° 96) 
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EDR9 : 5 ' CCCGATCCAGAACGTCTGGTCGGTGATCAGGTCGCTGTTCATCTGCCTCTTCGTCCCGAA 3 ' 
(SEQ ID N° 97) 

Les 40 (seulement 39 pour EDR8) deoxy-nucleotides situes a l'extremite 5' de 
5 ces oligonucleotides comportent une sequence correspondant a une sequence dans le 
gene cible (prfl2 dans le cas present) et les 20 deoxy-nucleotides situes le plus en 3' 
(figure en gras ci-dessus) correspondent a la sequence d ! une des extremites de la cassette 5 
excisable att3Qaac- (cf. figure 1 1). 

Le produit de PCR ainsi obtenu a ete utilise pour transformer la souche E. coli . 

10 KS272 contenant les plasmides pKOBEG et pSPM504 (cf. ci-dessus), comme decrit par 
Chaveroche et aL (Chaveroche et al 9 2000) (cf. figure 12 pour le principe, le plaWide 
pOS49.99 doit etre remplace par le plasmide pSPM504 et le plasmide obtenu n'est plus 
pSPM17 mais pSPM507). Ainsi, les bacteries ont ete transformees par electroporati^n , 
par ce produit de PCR et les clones ont ete selectionnes pour leur resistance , a 

15 Tapramycine. Les plasmides des clones obtenus ont ete extraits et digeres par plusieiifs 
enzymes de restriction, dans le but de verifier que le profil de digestion obtenu 
correspond au profil attendu s'il y a eu insertion de la cassette {att3Qaac-} dans le gene 
cible (or/12), c'est a dire si il y a bien eu recombinaison homologue entre les extremites; 
du produit PCR et le gene cible (Chaveroche et aL, 2000). La verification de.la. 

20 construction peut egalement etre realisee par toute methode connue de Fhomme du 
metier et notamment par PCR en utilisant les oligonucleotides appropries et sequen^age 
du produit de PCR. Un clone dont le plasmide possede le profil attendu a ete selectiorine 
et le plasmide correspondant a ete nomme pSPM507. Ce plasmide derive de pSPM504 
dans lequel orfl2 est interrompue par la cassette att3Qaac- (cf. figure 12). Uinsertion de 

25 la cassette s'accompagne d'une deletion dans le gene orfl2, Finterruption commence au 
niveau du trentieme codon de orfl2. II reste apres la cassette les 46 derniers codons de 
or/72. 

Le vecteur pSPM507 a ete introduit dans la souche Streptomyces ambofaciens OSC2 : 
(cf. ci-dessus) par transformation de protoplastes (Kieser, T et aL, 2000). Apres 
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transformation, les clones sont selectionnes pour leur resistance a rapraraycine. Les 

apramycine (antibiotique B) et sur milieu avec hygromycine (antibiotique A) (cf. figure 
9). Les clones resistants a rapramycine (ApraR) et sensibles a lTiygromycine (HygS) 

5 sont en principe ceux ou un double evenement de crossing over s'est produit et qui 
possedent le gene orfl2 interrompu par la cassette attSQaac-. Ces clones ont ete plus 
particulierement selectionnes et le remplacement de la copie sauvage de orfl2 par la 
copie interrompue par la cassette a ete verifie par hybridation. Ainsi, FADN total des 
clones obtenus, a ete digere par plusieurs enzymes, separe sur gel d' agarose, transfere 

10 sur membrane et hybride avec une sonde correspondant a la cassette att3Qaac- pour 
verifier la presence de la cassette dans l'ADN genomique des clones obtenus. Une 
deuxieme hybridation a ete effectuee en utilisant comme sonde un fragment d'ADN 
obtenu par PCR et correspondant a une tres large partie de la sequence codante du gene 
orfll, 

15 La verification du genotype peut egalement etre realisee par toute methode connue de 
1'homme du metier et notamment par PCR en utilisant les oligonucleotides appropries et 
sequen9age du produit de PCR. 

Un clone presentant les caracteristiques attendues {orfl2::att3Qaac-) a ete plus .'• • 
particulierement selectionne et nomme SPM507. II a pu en effet etre verifie grace aux 

20 deux hybridations que la cassette att3Qaac- etait bien presente dans le genome de ce 

clone et que Pon obtient bien le profil de digestion attendu dans le cas d'un , _ 

remplacement, a la suite d'un double evenement de recombinaison, du gene sauvage par 
la copie interrompue par la cassette attSQaac- dans le genome de ce clone. Ce clone 
possede done le genotype : orfl2::att3£2aac- et a ete nomme SPM507. H est inutile de .. J 

25 proceder a I 5 excision de la cassette pour 1' etude de 1* effet de l'inactivation de orfl2, au 
vu de P orientation des genes (cf. figure 3). En effet, le fait que orflSc soit oriente en 
sens oppose a orfl2 montre que ces genes ne sont pas co-transcrits. L'utilisation d'une 
cassette excisable permet en revanche d 5 avoir la possibility de se debarrasser du 
marqueur de selection a tout moment, notamment par transformation par le plasmide 

30 pOSV508. Un echantillon de la souche SPM507 a ete depose aupres de la Collection 
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Nationale de Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur 
Roux 75724 Paris Cedex 15, France, le 10 juillet 2002 sous le numero d'enregistrement 
1-2911. 



5 EXEMPLE 12 : Construction d'une souche de Streptomyces ambofaciens 
interrompue dans le gene orfl3c 

La cassette excisable att3Qaac- a ete amplifiee par PCR en utilisant comme 
matrice le plasmide pOSKl 102 (cf. ci-dessus) a l'aide des amorces suivantes : 

\ 

10 EDR3:5' ACCGGGGCGGTCCTCCCCTCCGGGGCGTCACGGCCGCGGAATCTGCCTCTTCGTCCCGAA 3'' 

(SEQ ID N° 98) " V 

EDR4 : 5 ' CACGCAGCGAGCCGACGCACTGATGGACGACACGATGGCCATCGCGCGCGCTTCGTTCGG 3 ' 

(SEQ ID N° 99) 

15 Les 40 deoxy-nucleotides situes a l f extremite 5 1 de ces oligonucleotides comporteM 
une sequence correspondant a une sequence dans le gene cible {orfl3c dans le cas 
present) et les 20 deoxy-nucleotides situes le plus en 3' (figure en gras ci-dessus) 
correspondent a la sequence d'une des extremites de la cassette excisable au3Qaac- (cf. . 
figure 11). 

20 Le produit de PCR ainsi obtenu a ete utilise pour transformer la souche E. coli 

KS272 contenant les plasmides pKOBEG et pSPM504 (cf. ci-dessus), comme decrit par 
Chaveroche et al (Chaveroche et al, 2000) (cf. figure 12 pour le principe, le plasmide 
pOS49.99 doit etre remplace pax le plasmide pSPM504 et le plasmide obtenu n'est plus 
pSPM17 mais pSPM508). Ainsi, les bacteries ont ete transformees par electroporation 

25 par le produit de PCR et les clones ont ete selectionnes pour leur resistance a 
Tapramycine. Les plasmides des clones obtenus ont ete extraits et digeres par plusieurs 
enzymes de restriction, dans le but de verifier que le profil de digestion obtenu 
correspond au profil attendu s'il y a eu insertion de la cassette (att3Qaac-) dans le gene 
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cible {orf!3c\ crest a dire si il y abien eu recombinaison homologue entxe les extremites 
du produit PCR et le gene cible (Chaveroche et aL, 2000). La verification de la 
construction pent, egalement _etre realisee par toute . metho.de . connue de Phomme du 
metier et notamment par PCR en utilisant les oligonucleotides appropries et-sequengage 
du produit de PCR. Un clone dont le plasmide possede le profil attendu a ete selectionne 
et le plasmide correspondant a ete nomine pSPM508. Ce plasmide derive de pSPM504 
dans lequel orfl 3c est interrompue par la cassette apramycine (cf. figure 12). Umsertion 
de la cassette s r accompagne d'une deletion dans le gene orfl 3c, Pinterruption commence 
au niveau du sixieme codon de orfl 3c. H reste apres la cassette les 3 derniers codons de 
orfl 3 c. 

Le vecteur pSPM508 a ete introduit dans la souche Streptomyces ambofaciens 
OSC2 (cf. ci-dessus) par transformation de protoplastes (Kieser, T et al. y 2000). Apres . 
transformation, les clones sont selectionnes pour leur resistance a Tapramycine.; Les .* 
clones resistants a Papramycine sont ensuite repiques respectivement sur milieu avec 
apramycine (antibiotique B) et sur milieu avec hygromycine (antibiotique A) (c£ figure 
9). Les clones resistants a rapramycine (ApraR) et sensibles a rhygromycine (HygS) 
sont en principe ceux ou un double evenement de crossing over s'est produit et qui 
possedent le gene orfl 3c interrompu par la cassette att3Qaac-. Ces clones ont ete plus 
particulierement selectionnes et le remplacement de la copie sauvage de orfl 3c par la 
copie interrompue par la cassette a ete verifie par hybridation. Ainsi, PADN total des 
clones obtenus, a ete digere par plusieurs enzymes, separe sur gel d' agarose, transfere 
sur membrane et hybride avec une sonde correspondant a la cassette att3Qaac- pour 
verifier la presence de la cassette dans PADN genomique des clones obtenus. Une . 
deuxieme hybridation a ete effectuee en utilisant comme sonde un produit de PCR 
correspondant a une sequence debordant d'une centaine de paires de base en amont et eh 
aval de la sequence codante de orfl 3c. La verification du genotype peut egalement etre 
realisee par toute methode connue de Phomme du metier et notamment par PCR en 
utilisant les oligonucleotides appropries et sequen9age du produit de PCR. 
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Un clone presentant les caracteristiques attendues (prfl3c: :att3£2aac-) a ete plus 
particulierement selectionne et nomme SPM508. II a pu en effet etre verifie grace aux 
deux hybridations que la cassette att3Qaac- etait bien presente dans le genome de ce 
clone et que Ton obtient bien le profil de digestion attendu dans le cas d'un 

5 remplacement, a la suite d'un double evenement de recombinaison, du gene sauvage par 
la copie interrompue par la cassette att3Qaac- dans le genome de ce clone. Ce clone 
possede done le genotype : orfl3c::att3Qaac- et a ete nomme SPM508. II est inutile de 
proceder a P excision de la cassette pour P etude de Peffet de Pinactivation de orfl3c y au 
vu de P orientation des genes (cf figure 3), le fait que orfl4 soit oriente en sens oppose a 

10 orfl3c montre que ces genes ne sont pas co-transcrits. L'utilisation d'une cassette 
excisable permet en revanche d ? avoir la possibilite de se debarrasser du marqueur de 
selection a tout moment. Un echantillon de la souche SPM508 a ete depose aupres de la 
Collection Nationale de Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue 
. du Docteur Roux 75724 Paris Cedex 15, France, le 10 juillet 2002 sous le numero 

15 d'efiregistrement 1-2912. 



EXEMPLE 13 Construction d'une souche de Streptomyces ambofaciens 
interrompue dans le gene orfl4 

La cassette excisable att3Qaac- a ete amplifiee par PCR en utilisant comme 
20 matrice le plasmide pOSKl 102 (cf. ci-dessus) a Paide des amorces suivantes : 

EDR5 : 5 ' GGGCGTGAAGCGGGCGAGTGTGGATGTCATGCGAGTACTCATCGCGCGCGCTTCGTTCGG 3 ' 
( SEQ ID N° 100) 

EDR6 : 5 ' CGGGAAACGGCGTCGCACTCCTCGGGGGCCGCGTCAGCCCATCTGCCTCTTCGTCCCGAA 3 ' 
(SEQ ID Kf° 101) 



25 
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Les 40 deoxy-nucleotides situes a Textremite 5' de ces oligonucleotides comportent 
une sequence correspondant a une sequence dans le gene cible (orfl4 dans le cas 

present) et_ les 20 deoxy-nucleotides situes le .plus en 3'.. (figure en gras _ ci-dessus) . 

correspondent a la sequence d'une des extremites de la cassette excisable att3Qaac- (cf, 
5 figure 11). 

Le produit de PCR ainsi obtenu a ete utilise pour transformer la souche E. coli 
KS272 contenant les plasmides pKOBEG et pSPM504 (of. ci-dessus), comme decrit par 
Chaveroche et al (Chaveroche et al. 9 2000) (cf. figure 12 pour le principe, le plasmide 
pOS49.99 doit etre remplace par le plasmide pSPM504 et le plasmide obtenu n'est plus" 

10 pSPM17 mais pSPM509). Ainsi, les bacteries ont ete transformees par electroporation 
par le produit de PCR et les clones ont ete selectionnes pour leur resistance a 
F apramycine. Les plasmides des clones obtenus ont ete extraits et digeres par plusieurs 
enzymes de restriction, dans le but de verifier que le profil de digestion obtenu 
correspond au profil attendu s'il y a eu insertion de la cassette (att3Qaac-) dans le gene 

15 cible (or/14), c'est a dire si il y a bien eu recombinaison homologue entre les extremites 
du produit PCR et le gene cible (Chaveroche et al. 9 2000). La verification de la 
construction peut egalement etre realisee par toute methode connue de 1'homme du 
metier et notamment par PCR en utilisant les oligonucleotides appropries et sequen9age 
du produit de PCR. Un clone dont le plasmide possede le profil attendu a ete selectionne ; 

20 et le plasmide correspondant a ete nomme pSPM509. Ce plasmide derive de pSPM504 
dans lequel orfl4 est interrompu par la cassette apramycine (cf. figure 12). Uinsertion de . 
la cassette s f accompagne d'une deletion dans le gene orfl4, 1 'interruption commence au 
niveau du quatrieme codon de orfl4. H reste apres la cassette le dernier codon de orfl 4. 

Le vecteur pSPM509 a ete introduit dans la souche Streptomyces ambofaciens 
25 OSC2 (cf. ci-dessus) par transformation de protoplastes (Kieser, T et al, 2000). Apres 
transformation, les clones sont selectionnes pour leur resistance a Tapramycine. Les 
clones resistants a V apramycine sont ensuite repiques respectivement sur milieu avec 
apramycine (antibiotique B) et sur milieu avec hygromycine (antibiotique A) (cf. figure 
9). Les clones resistants a Tapramycine (ApraR) et sensibles a l f hygromycine (HygS) 



) 
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sont en principe ceux ou un double evenement de crossing over s'est produit et qui 
possedent le gene orfl4 interrompu par la cassette att3Qaac~. Ces clones ont ete plus 
particulierement selectionnes et le remplacement de la copie sauvage de orfl4 par la 
copie interrompue par la cassette a ete verifie par hybridation. Ainsi, PADN total des 
clones obtenus, a ete digere par plusieurs enzymes, separe sur gel d'agarose, transfere 
sur membrane et hybride avec une sonde correspondant a la cassette att3Qaac- pour 
verifier la presence de la cassette dans PADN genomique des clones obtenus. Une 
deuxieme hybridation a ete effectuee en utilisant comme sonde un produit de PCR 
correspondant a une sequence debordant d'une centaine de paires de base en amont et eh 
aval de la sequence codante de or/74. La verification du genotype peut egalement etre 
realisee par toute methode connue de 1'homme du metier et notamment par PCR en 
utilisant les oligonucleotides appropries et sequen?age du produit de PCR. ' ; 

Un clone presentant les caracteristiques attendues (orfl4::att3£2aac-) a ete plus; 
particulierement selectionne et nomine SPM509. II a pu en effet etre verifie. grace aux 
deux hybridations que la cassette att3Qaac- etait bien presente dans le genome de c6 
clone et que Ton obtient bien le profil de digestion attendu dans le cas d'uri> 
remplacement, a la suite d'un double evenement de recombinaison, du gene sauvage par 
la copie interrompue par la cassette att3Qaac- dans le genome de ce clone. Ce clone 
possede done le genotype : orfl4::att3£2aac- et a ete nomme SPM509. H est inutile de 
proceder a 1' excision de la cassette pour V etude de V effet de l'inactivation de or/14, au 
vu de P orientation des genes (cf. figure 3), le fait que orflSc soit oriente en sens oppose 
a or/14 montre que ces genes ne sont pas co-transcrits. L'utilisation d'une cassette 
excisable permet en revanche d'avoir la possibilite de se debarrasser du marqueux de 
selection a tout moment. Un echantillon de la souche SPM509 a ete depose aupres de la 
Collection Nationale de Cultures de Microorganismes (CNCM) Institut Pasteur, 25 3 rue 
du Docteur Roux 75724 Paris Cedex 15, France, le 10 juillet 2002 sous le numero 
d' enregistrement 1-29 13. 
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EXEMPLE 14: Construction d'une souche de Streptomyces ambofaciens 
interrompue dans le gene orf6* 

L'inactivation du gene orf6* a ete realisee grace a la technique des cassettes 
excisables (cf. ci-dessus et figure 10). Pour cela, le cosmide pSPM7 a ete utilise corame 
5 matrice pour amplifier un fragment du gene orf6* grace aux oligonucleotides suivants : 

C9583 : 5' CTGCAGGTGCTCCAGCGCGTCGATCT 3' (oligo sens) (SEQ ID N° 102) 

C9584 : 5' CTGCAGACGGAGGCGGACCTGCGGCT 3' (oligo antisens) (SEQ ID N° 
103) 

Les 20 deoxy-nucleotides situes a Textremite 3' de ces oligonucleotides 
10 correspondent a une sequence situee dans la partie codante du gene or/6* (SEQ ID N° 
13) et les 6 deoxy-nucleotides situes les plus en 5 f correspondent a la sequence dun site 
Pstl permettant de faciliter le clonage par la suite. Le fragment d 5 ADN amplifie fait une 
taille d'environ 1,11 kb. Ce produit de PCR est clone dans le vecteur pGEM-T Easy 
(commercialise pax la societe Promega (Madison, Wisconcin, USA)) ce qui a permis 
15 d'obtenir le plasmide nomme pBXLl 111 (cf. figure 1 6). 

La cassette excisable attlQhyg+ a ensuite ete introduite dans la sequence codante 
du gene orf6*. Pour cela, le plasmide pBXLllll a ete digere par les enzymes de 
restriction Smal et AspllSI et le produit de digestion a ete traite par P enzyme de 
Klenow. Cette manipulation permet de realiser une deletion interne de 120 pb dans la 

20 sequence codante du gene or/6* (cf. figure 15). De plus, de part et d'autre des sites de 
restrictions, il reste respectivement 511 pb et 485 pb de la sequence de orf6* qui 
permettront la recombinaison homologue pour Pinactivation du gene orf6*. La cassette : 
excisable attJX2hyg+ a ete preparee a partir du plasmide pattl^hyg+ (cf. ci-dessus) par 
digestion de ce plasmide par EcoRV. Cette derniere a ensuite ete sous-clonee dans le 

25 vecteur pBXLllll prealablement prepare comme decrit ci-dessus (digestion Smal et 
Aspl\%l puis traitement a P enzyme de Klenow). Le plasmide obtenu a ete nomme 
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pBXL1112 (cf. figure 17). Dans cette construction, le gene or/6* comporte une deletion 
de 120pb et est interrompu par la cassette attlQhyg+. 

Le plasmide pBXL1112 a ete ensuite digere par P enzyme Pstl (site bordant la 
cassette puisque present dans les oligonucleotides PCR) et Pinsert Pstl de 3.7 kb 
5 comprenant une partie de orf6* interrompu par la cassette attl£2hyg+ a ensuite ete clone 
au niveau du site Pstl du plasmide pOJ260 (cf ci-dessus). Le plasmide ainsi obtenu a ete' 
nomme pBXLl 113. 

Le vecteur pBXLl 113 a ete introduit dans la souche Streptomyces ambofaciens 
OSC2 (cf. ci-dessus) par transformation de protoplastes (Kieser, T et al, 2000). Apres 

10 transformation, les clones sont selectionnes pour leur resistance a rhygromycine. Les 
clones resistants a lliygromycine sont ensuite repiques respectivement sur milieu avec 
hygromycine (antibiotique B) et sur milieu avec apramycine (antibiotique A) (cf. figure 
9). Les clones resistants a rhygromycine (HygR) et sensibles a Tapramycine (ApraS) 
sont en principe ceux ou un double evenement de crossing over s'est produit et qui 

15 possedent le gene or/6* interrompu par la cassette attl£2hyg+. Ces clones ont etc plus 
parti culierement selectionnes et le remplacement de la copie sauvage de orf6* par la 
copie interrompue par la cassette a ete verifie par la technique du Southern blot. Ainsi, 
l'ADN total des clones obtenus, a ete digere par plusieurs enzymes, separe sur gel 
d' agarose, transfere sur membrane et hybride avec une sonde correspondant au gene hyg 

20 (obtenu par PCR) pour verifier la presence de la cassette dans PADN genomique des 
clones obtenus. Une deuxieme hybridation a ete effectuee en utilisant comme sonde 
Pinsert Pstl-Pstl contenant le gene orf&* y d'ttne taille d' environ 1,1 kb et obtenu a partir 
du plasmide pBXLllll (cf. ci-dessus et figure 16). La verification du genotype peut 
egalement etre realisee par toute methode connue de Phomme du metier et notammeht 

25 par PCR en utilisant les oligonucleotides appropries et sequencage du produit de PCR. 

Un clone presentant les caracteristiques attendues (orf6*::attl£2hyg J r) a ete plus 
particulierement selectionne et nomme SPM501. II a pu en effet etre verifie grace aux 
deux hybridations que la cassette attlQhyg+ etait bien presente dans le genome de ce 
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clone et que l'on obtient bien le profil de digestion attendu dans le cas d'un 
remplacement, a la suite d'un double evenement de recombinaison, du gene sauvage par 
- la copie interrompue par la cassette -attl£ihyg+- dans le genome de -ce clone. ..Ce clone, 
possede done le genotype : orf6*::attinhyg+ et a ete nomme SPM501. Un echanullon 
5 de la souche SPM501 a ete depose aupres de la Collection Nationale de Cultures de 
Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur Roux 75724 Paris Cedex 
1 5, France, le 10 juillet 2002 sous le numero d'enregistrement 1-2909. 

La souche SPM501 a ete transformee par le vecteur pOSV508 par transformation 
de protoplastes pour provoquer l'excision de la cassette (cf. figure 14). Le plasmide 

10 pOSV508 est derive du plasmide pWHM3 (Vara J et ct/,1989) (cf. figure 13) dans 
lequel les genes xis et int de pSAM2 (Boccard F. et aL, 1989b) places sous le contrdle 
du promoteur pure (Amann, E. et aL, 1988) ont ete ajoutes (cf. figure 14). L' introduction 
dans la souche SPM501 du plasmide pOSV508 portant les genes xis et int de pSAM2 
permet l'excision efficace par recombinaison site specifique de la cassette excisable entre 

15 les sites attL et attR flanquant cette cassette (Raynal A. et aL, 1998) (figure 10). Parmi 
les transformants, selectionnes pour leur resistance au thiostrepton due au gene tsr porte 
par pOSV508, on choisit ceux devenus sensibles a l'hygromycine dont le gene de 
resistance est porte par la cassette attlQhyg+, l'excision entraine en effet la perte de ce 
gene de resistance (cf. figure 10). Le plasmide pOSV508 est instable et apres deux 

20 passages successifs sur milieu sans antibiotique des clones isoles sont repiques sur 
milieu avec thiostrepton et sur milieu sans thiostrepton. Les clones sensibles ail 
thiostrepton ont perdu pOSV508. II a ete verifie que l'excision de la cassette a bien eu 
lieu en phase dans le gene or/6* par PCR et sequencage du produit PCR. L' interruption 
commence au 158*™ codon, 40 codons sont deletes (120pb) et l'excision de la cassette 

25 laisse une sequence « cicatricielle » attl caracteristique de 33pb : 5' 
ATCGCGCGCTTCGTTCGGGACGAAGAGGTAGAT 3' (SEQ ID N° 104). 

La souche ainsi obtenue et possedant le genotype voulu (orf6*::attl) a ete nommee 
SPM502. 
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Un echantillon de la souche SPM502 a ete depose aupres de la Collection Nationale de 
Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur Roux 75724 
Paris Cedex 15, France, le 10 juillet 2002 sous le numero d'enregistrement 1-2910. 



5 EXEMPLE 15 : Analyse des souches de Streptomyces ambofaciens interrompue 
dans les genes orf2, or/3, orfS, orflO, orfl2, orfl3c, or/14, orf6* 

Pour tester la production en spiramycine des diverses souches obtenues, un test 
microbiologique base sur la sensibilite d'une souche de Micrococcus luteus a ete mis au 
point (cf. (Gourmelen A. et aL, 1998)). La souche de Micrococcus luteus utilisee est une ' 

10 souche derivee de la souche DSM1790 naturellement sensible a la spiramycine (cette 
souche est disponible notamment aupres de la German Collection of Microorganisms 
and Cell Cultures (Deutsche Sammlung von Mikro-organismen und Zellkulturen GmbH, 
DSMZ), (Braunschweig, Allemagne), sous le numero DSM1790), la souche utilisee 
dans le present test differe de la souche DSM1790 en ce qu'elle est resistante, a la 

15 congocidine. Cette souche est un mutant spontane obtenu par selection sur milieu 
contenant des doses croissantes de congocidine. Une telle souche a ete selectionnee du 
fait que Streptomyces ambofaciens produit a la fois de la spiramycine et de la 
congocidine. Le but etant de doser la production en spiramycine des diverses souches 
obtenues grace a un test microbiologique base sur la sensibilite d'une souche de 

20 Micrococcus luteus, il est necessaire de disposer d'une souche resistante a la 
congocidine. 

Les differentes souches de Streptomyces a tester ont ete cultivees dans des 
erlenmeyers a baffles (erlenmeyers chicanes) de 500 ml contenant 70 ml de milieu MP5 
(Pernodet et aL, 1993). Les erlenmeyers chicanes ont ete inocules a une concentration 1 
25 initiate de 2.5 10 6 spores/ml des differentes souches de S. ambofaciens et mises a 
pousser a 27°C sous agitation orbitale de 250 rpm. Des prelevements de 2 ml de 
suspensions ont ete realises apres 48, 72 et 96 heures de culture et centrifuges. Les 
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differents surnageants ont ensuite ete congeles a -20°C. Une dilution au dixieme de ces 
surnageants dans du milieu de culture sterile est utilisee pour le test (c£ figure 1 8). 

La souche indicatrice de Micrococcus luteus resistante a la congocidine mais 
sensible a la spiramycine a ete cultivee dans du milieu 2TY (Sambrook et ah, 1989) 
contenant de la congocidine a 5 |xg/ml pendant 48h a 37°C. La densite optique (DO) de 
la culture est mesuree et cette culture est diluee de fa<?on a ajuster la densite optique a 4. 
0,4 ml de cette pre-culture est dilue dans 40 ml de milieu DAMS (Difco Antibiotic 
Medium 5, commercialise par la societe Difco), prealablement porte a une temperature 
d'environ 45°C. Ce milieu est ensuite coule dans une boite carree de 12x12 cm et laisse 
a reposer a temperature ambi ante. . 

Une fois le milieu refroidi et solidifie, des disques en papier Whatman AA (cf. 
Gourmelen A. et ah, 1998) de 12 mm de diametre ont ete imbibes de 70 pi de la dilution 
au dixieme de chaque surnageant et deposes sur la surface de la boite. Des disques 
imbibes d'une solution de spiramycine de differentes concentrations (2-4-8 p.g/ml dans 
du milieu de culture MP5) sont utilises comme gamme etalon. Les boites sont laissees a 
4°C pendant 2 h de fa9on a permettre la diflfusion des antibiotiques dans Tagar puis sont 
incubees a 37°C pendant 24 a 48h. 

Si le disque contient de la spiramycine, celle-ci diffuse dans l'agar et inhibe la 
croissance de la souche indicatrice de Micrococcus luteus, Cette inhibition cree un 
« halo » autour du disque, ce halo refletant la zone ou la souche de Micrococcus luteus 
n'a pas pousse. La presence de ce halo est done une indication de la presence de 
spiramycine et permet de determiner si la souche de S. ambofaciens correspondant au 
disque en question est productrice ou non productrice de spiramycine. Une comparaisoh 
avec les diametres d'inhibition obtenus pour la gamme etalon permet d'obtenir line 
indication de la quantite de spiramycine produite par cette souche. 

Les differentes souches decrites dans les exemples precedents ont ete utilisees 
dans ce test pour detecter leur production en spiramycine. Les resultats obtenus ont ete 
regroupes dans le Tableau 38. 
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Tableau 38 



Souche 


Gene inactive 


Exemple dans 
lequel la 
souche est 
decrite 


Phenotype : 
Producteur (+) ou 
non-producteur (-) de 
spiramycine 


ATCC23877 


Aucun 


1 


(+) 


OS49.16 


orj3y.nh.yg 


2 


(-) 


OS49.67 


or/3 deletion en phase 


6 


(-) . 


OS49.107 


orf8::£2hyg 


7 


(-) •> 


OS49.50 


or/10:: Qhyg 


8 




OSC2 


Aucun 


10 


(+) f 


SPM21 


orf2::att3Qaac- 


10 


(-) ' 


SPM22 


orf2::att3 deletion en phase 


10 


(-) 


SPM501 


orf6*::attinhyg+ 


14 


(-) 


SPM502 


or/6*::attl deletion en phase 


14 


(+) 


SPM507 


orfl2::att3Qaac- 


11 


(-) 


SPM508 


orfl 3c: :att3Qaac- 


12 


(+) 


SPM509 


orfl4::alt3Qaac- 


13 


(-) 



Ces resultats permettent de tirer un certain nombre de conclusions en ce qui 
concerne la fonction des differents genes impliques dans la biosynthese de la 
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spiramycine. Ainsi le gene or/3 est essentiel a la biosynthese de la spiramycine. En effet 
une inactivation en phase dans ee gene conduit a une souche (OS49.67, (cf. exemple 6)) 
_ . _. _ ne produisant_plus de spiramycine. L'inactivation_en_phase permet .d'ecarter.l'hypothese. 
d'une eventuelle influence de la cassette introduite sur Pexpression des genes situes en 
5 aval de or/3. 

De meme, les genes or/8 et orflO codent des proteines essentielles a la biosynthese 
de la spiramycine puisque les souches OS49.107 et OS49.50 ont un phenotype non 
producteur. De plus, dans ces deux dernieres souches, c'est bien Y inactivation du gene 
correspondant qui est responsable de ce phenotype non producteur, puisqu'au vu de 
10 P orientation des differentes orfs (cf. figure 3), la construction introduite ne peut avoir 
d' effet polaire. 

L'etude des souches possedant une cassette excisable perrnet egalement de tirer un 
certain nombre de conclusion en ce qui concerne la fonction des genes interrompus. La 
souche SPM507 possede le genotype : orf!2::att3£2aac-. H est inutile de proceder a 

15 l'excision de la cassette pour l'etude de 1'effet de 1 'inactivation de or/72, au vu de 
T orientation des genes (cf. figure 3). Le fait que orfl3c soit oriente en sens oppose a 
or/72 montre que ces genes ne sont pas co-transcrits. L'utilisation d'une cassette 
excisable permet en revanche d'avoir la possibilite de se debarrasser du marquevir de 
selection a tout moment. Le phenotype de la souche SPM507 est non producteur, on 

20 peut done en conclure que le gene orfll est un gene essentiel a la biosynthese de la 
spiramycine chez S. ambofaciens. 

La souche SPM508 possede le genotype : orfl3c::att3Qaac-. II est inutile de 
proceder a l'excision de la cassette pour l'etude de l'effet de 1'inactivation de orf!3c, au 
vu de l'orientation des genes (cf figure 3). Le fait que or/24 soit oriente en sens oppose 
25 a or/13c montre que ces genes ne sont pas co-transcrits. L'utilisation d'une cassette 
excisable permet en revanche d 'avoir la possibilite de se debarrasser du marqueur de 
selection a tout moment. Le phenotype de la souche SPM508 est producteur, on peut 
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done en conchire que le gene orfl 3c n'est pas un gene essentiel a la biosynthese de la 
spiramycine chez S. ambofaciens. 

La souche SPM509 possede le genotype : orf!4::att3Qaac-. II est inutile de 
proceder a P excision de la cassette pour l'etude de Feffet de l'inactivation de orfl 4^ au 
5 vu de 1'orientation des genes (cf. figure 3), le fait que orflSc soit oriente en sens oppose 
a orfl4 montre que ces genes ne sont pas co-transcrits. L'utilisation d'une cassette 
excisable permet en revanche d' avoir la possibility de se debarrasser du marqueur de 
selection a tout moment. Le phenotype de la souche SPM509 est non producteur, on 
peut done en conclure que le gene orfl 4 est un gene essentiel a la biosynthese de la 
10 spiramycine chez S. ambofaciens. 

La souche SPM21 possede le genotype : orf2::att3Qaac- : Le phenotype de cette 
souche est non producteur de spiramycines. Cependant, T orientation des genes *orfl a 
or/8 (cf. figure 3) laisse penser que ces genes sont cotranscrits. Aussi, le phenotype 
observe peut etre du a un effet polaire de la cassette introduite dans orf2 sur 1' expression 

15 de genes situes en aval dans l'operon. La souche SPM22 possede le genotype orf2::att3 
et a ete obtenue apres excision en phase de la cassette introduite. L y excision 'de la " 
cassette laisse seulement une sequence « cicatricielle » caracteristique (cf. exemple 10). 
La souche SPM22 etant egalement de phenotype non producteur, on peut en conclure 
que le gene or/2 est un gene essentiel a la biosynthese de la spiramycine chez S. ; 

20 ambofaciens. On observe ici uniquement Peffet du a l'inactivation de orf2. 

La souche SPM501 possede le genotype : orf6*::attlQhyg±. Le phenotype de 
cette souche est non producteur de spiramycines. Cependant, les genes or/5* et orf6* 
(cf. figure 3) ayant la meme orientation, le phenotype observe peut etre du a un effet 
polaire de la cassette introduite dans orfS* sur Texpression de orf5*. La disposition de. 
25 ces genes laisse penser qu'ils peuvent etre cotranscrits. Pour repondre a cette question, la 
souche SPM502 a ete obtenue apres excision en phase de la cassette introduite. Dans 
cette souche, on observe uniquement Peffet de rinactivation de orf6*> Cette souche 
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possede le genotype orf6*::attl (cf. exemple 14). L'excision de la cassette laisse 
seulement une sequence « cicatricielle » en phase (cf. exemple 14). La souche SPM502 
possede- un phenotype - -producteur (cette -souche ne produit cependant que de la 
spiramycine I (cf*. exemple 16)). On peut done conclure que le gene orf5* est un gene 
essentiel a la biosynthese de la spiramycine chez S. ambofaciens, puisque son 
inactivation indirecte dans la souche SPM501 conduit a un phenotype non producteur. 
Par centre ; le gene or/6* n'est pas un gene essentiel a la biosynthese de la spiramycine I 
chez S. ambofaciens (par contre il est essentiel a la production de spiramycine II et III 
(cf exemple 16)). 



EXEMPLE 16, Dosage de la production des spiramycines I, II et III dans les 
souches mutantes obtenues 

Les differentes souches a tester ont ete cultivees chacune dans 7 erlensmeyers 
chicanes de 500 mL contenant 70 ml de milieu MPS (Pernodet et al, 1993). Les erlens 
ont ete inocules par 2.5 10 6 spores/ml des differentes souches de S. ambofaciens et 
mises a pousser a 27°C sous agitation orbitale de 250 rpm pendant 72 heures. Les 
cultures correspondant au meme clone sont rassemblees, eventuellement filtrees sur ; 
filtre plisse, et centrifugees 15 min a 7000 tr/min. Les differents surnageants ont ensuite 
ete stockes a-30°C. 

Les dosages ont ete effectues par Chromatographie Liquide a Haute Performance 
(CLHP) par appariement d'ions. L'analyse CLHP du milieu de culture permet de 
determiner precisement la concentration des trois formes de spiramycine. La colonne 
utilisee (Macherey-Nagel) est remplie avec une phase Nucleosil de silice greffee octyle. 
La granulometrie est de S\im et la taille des pores 100A. Le diametre interne de la 
colonne est de 4,6mm et sa longueur 25cm. La phase mobile est un melange de tampon 
H3PO4 (pH2,2) et d'acetonitrile 70/30 (v/v) contenant 6,25g/L de perchlorate de 
NaC10 4 . L'analyse est realisee en regime isocratique avec un debit fixe a 1 ml/min. La 
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colonne est thermoregulee a 23°C. La detection est assuree par spectrophotometrie UV 
a 238nm. L'echantillon est refrigere a +10°C et la quantification est determinee a partir 
de l'aire des pics (par etalonnage externe). Dans ces conditions, les temps de retention 
de la spiramycine I, II et IE sont respectivement d'environ 17; 21 et 30 minutes, comme 
il a pu etre verifie grace a un echantillon commercial comprenant les trois formes de 
spiramycine. 

La souche OSC2 possede un phenotype producteur de spiramycine. C'est la 
souche parentale utilis6e pour l'obtention des souches possedant une cassette excisable 
(cf. exemple 15). Cette souche a done ete utilisee comme temoin positif de production 
des trois formes de spiramycine. Cette souche produit bien les trois formes de 
spiramycines comme il a ete verifie par CLHP (cf. figure 19). 



L' etude des souches possedant une cassette excisable permet de tirer un certain 
nombre de conclusions en ce qui concerne la fonction des genes interrompus. La soUche 
SPM507 possede le genotype : orfl2::att3Qaac-. Le phenotype de la souche SPM507 
15 est non producteur (cf. exemple 1 5), on peut done en conclure que le gene orfl2 est un 
gene essentiel a la biosynthese de la spiramycine chez S. ambofaciens. Cette souche ne 
produit plus de spiramycines comme il a ete verifie par CLHP (cf. figure 22). Ce resultat 
confirme le caractere essentiel du gene orfl2 dans la biosynthese de la spiramycine. 

La souche SPM508 possede le genotype : orfl3c::att3Qaac-. Le phenotype de la 
20 souche SPM508 est producteur de spiramycine (cf. exemple 15), on peut done en 
conclure que le gene orfl 3c n'est pas un gene essentiel a la biosynthese de la 
spiramycine chez S. ambofaciens. Cette souche produit de la spiramycine I, II et HI 
comme il a ete verifie par CLHP (cf. figure 23). Ce resultat confirme que le gene orfl 3c 
n'est pas un gene essentiel a la biosynthese des spiramycines I, II et III ches S. 
25 ambofaciens. 

La souche SPM509 possede le genotype : orfl4::att3Qaac-. Le phenotype de la 
souche SPM509 est non producteur, on peut done en conclure que le gene orf!4 est un 
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gene essentiel a la biosynthese de la spiramycine chez S. ambofaciens. Cette souche ne 
produit plus de spiramycines comme il a ete verifie par CLHP (cf. figure 24). Ce resultat 
. . confirme Pessentialite du gene dans la biosynthese de. la spiram ..... 

La souche SPM501 possede le genotype : orf6*::attl£2hyg±. Le phenotype de 
5 cette souche est non producteur de spiramycines. Cette souche ne produit plus de 
spiramycines comme il a ete verifie par CLHP (cf. figure 20). Cependant, les genes 
orf5* et or/6* (cf. figure 3) ayant la rneme orientation, le phenotype observe peut etre du 
a un effet polaire de la cassette introduite dans orf6* sur V expression de orf5* dans 
Toperon. Ceci laisse penser que ces genes sont cotranscrits. Pour repondre a cette 

10 question, la souche SPM502 a ete obtenue par excision de la cassette introduite, 
produisant une deletion en phase dans le gene or6* et restaurant P expression de or/5* 
Cette souche possede le genotype orf6*::attl (cf exemple 14 et 15). U excision de la 
cassette laisse seulement une sequence att « cicatricielle » en phase (cf. exemple 14). La\ 
souche SPM502 possede un phenotype producteur de spiramycine. Cependant, comme il : 

15 a ete prouve par CLHP, cette souche ne produit que de la spiramycine I et ne produit pas 
de spiramycine II et III (cf. figure 21). On peut done conclure de ces resultats que le 
gene orf5* est un gene essentiel a la biosynthese de la spiramycine chez S. ambofaciens, 
puisque son inactivation indirecte dans la souche SPM501 conduit a un phenotype non 
producteur de spiramycine (cf. figure 20). Par contre ; le gene or/6* n'est pas un gene 

20 essentiel a la biosynthese de la spiramycine I chez S. ambofaciens, puisque Pinactivation 
de ce gene conduit a un phenotype producteur de spiramycine I (cf. figure 21). 
Cependant, orf6* est essentiel a la production de spiramycine II et III (cf. exemple 16)). 
Le gene orf6* code done bien une acyl-transferase responsable de la modification du 
platenolide a la position 3 (cf. figure 1). 

25 
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EXEMPLE 17 : Determination du point de demarrage de la traduction de orflO et 
amelioration de la production en spiramycines 

17.1 Construction des plasmides nSPM523. t)SPM 524 et pSPM525 : 

Le gene or/10 a ete identifie chez Streptomyces ambofaciens et a ete designe 

5 srmR par Geistlich et ah (Geistlich, M., et al., 1992). L'inactivation du gene orflO a 
ete realisee (cf. exemple 8). H apu ainsi etre montre que la souche resultante ne 
produit plus de spiramycines (cf. exemple 15). Ceci confrrme que le gene orflO est 
bien implique dans la biosynthese des spiramycines. La proteine codee par ce gene 
est done bien essentielle a la biosynthese des spiramycines. Cependant, V analyse de 

10 la sequence montre que deux codons ATG situes dans la meme phase de lecture 
peuvent etre utilises pour la traduction de orflO (cf. Figure 28). Un des deux codons „. 
possible (le codons le plus en amont) demarre a la position 10656 de la sequence g. 
donnee en SEQ ID N° 1 5 alors que l'autre codon possible situe plus en aval demarre a * 
la position 10809 (cf. SEQ ID N° 1). Avant de tester un eventuel effet de la 

15 surexpression de srmR siir la production de spiramycine, il est important de v 
determiner dans un premier temps le point de demarrage de la traduction. 

Dans le but de determiner le site de demarrage de la traduction, trois 
constructions comportant trois formes tforflO ont ete realisees. Ces dernieres ont ete 
obtenues par PCR en utilisant des oligonucleotides comportant soit un site de 
20 restriction Hin&lll soit un site de restriction BamBI. 

Le premier couple utilise pour P amplification correspond aux oligonucleotides 
suivants : 
EDR39 : 

5 'CCCAAGCTTGAGAAGGGAGCGGACATTCATGGCCCGCGCCGAACGC3 ' 
25 (SEQ ID N° 122) (le site Hindill figure en gras) 
EDR42 \ 

5'CGGGATCCGGCTGACCATGGGAGACGGGCGCATCGCCGAGTTCAGC3' 
(SEQ ID N° 123) (le site BamHl figure en gras) 
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Le couple d'amorces EDR39-EDR42 pennet l'amplification d'un fragment d'or/70 
comportant l'ATG situe le plus en 3' (position 10809 dans la sequence donnee en 
- SEQ .ID N° l) (cf. Figure 28), Le fragment obtenu fait une taille d'environ 2 kb et 
sera appele par la suite "or/70 court", il ne contient pas le promoteur de or/10. Ce 
fragment de 2kb a ete clone dans le vecteur pGEM-T easy pour donner naissance au 
plasmidepSPM520. 

Le deuxieme couple utilise pour 1' amplification correspond aux oligonucleotides 
suivants : 
EDR40 : 

5 ' CCC AAGCTTGAGAAGGGAGCGGACATTCAATGCTTTGGTAAAGCAC3 ' 
(SEQ ID N° 1 24) (le site HindSE fi gure en gras) 
EDR42 : 

5 ' CGGGATCCGGCTGACCATGGG AGACGGGCGCATCGCCGAGTTCAGC3 » 
(SEQ ID N° 123) (le site BamHl figure en gras) 

Le couple d'amorces EDR40-EDR42 permet l'amplification d'un fragment VorflO 
comportant 1ATG situe le plus en 5' (position 10656 dans la sequence donnee en 
SEQ ID N° 1) (cf. Figure 28). Ce fragment de 2,2 kb appele par la suite "or/70 long" 
a ete clone dans le vecteur pGEM-T easy pour donner naissance au plasmide 
pSPM52 1 , ce plasmide ne contient pas le promoteur de or/10. 

Le troisieme couple utilise pour l'amplification correspond aux oligonucleotides 
suivants : 

EDR41 : 

5 ' -CCCAAGCTTTCA AGGAACGACGGGGTGGTCAGTC AAGT-3 ' 
(SEQ ID N° 125) (le site HindUl figure en gras) 
EDR42 : 

5 'CGGGATCCGGCTGACCATGGGAGACGGGCGCATCGCCGAGTTCAGC3 ' 
(SEQ ID N° 123) (le site BamHl figure en gras) 

Le couple d'amorces EDR41-EDR42 permet l'amplification du gene or/10 avec les 
deux ATG, ainsi que son propre promoteur (cf. Figure 28). Ce fragment de 2,8 kb 
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appele par la suite "orflO pro" a ete clone dans le vecteur pGEM-T easy pour dormer 
naissance au plasmide pSPM522. 

Le fragment " or/70 pro" a ete obtenu en utilisant comme matrice TADN 
chromosomique de la souche OSC2. Les fragments "orfl 0 court" et "orfl 0 long" ont 
5 quant a eux ete obtenus en utilisant comme matrice TADN du fragment "orfl 0 pro" 
prealablement purifie. 

Les inserts Hindlll-BamHl des plasmides pSPM520, pSPM521 et pSPM522 . 
ont ensuite ete sous-clones dans le vecteur pUWL201 (plamside derive du plasmide 
pUWL199 (Wehmeier UF, 1995) dans lequel le fragment Kpnl-BamR! de la region 

10 du promoteur de ermE (cf. Bibb et al., 1985, notamment figure 2) portant une 
mutation augmentant la force du promoteur (promoteur ermE*) (Bibb et al, 1994) a 
ete introduit (cf. Doumith et al. 9 2000)) prealablement digere par les enzymes 
Hindlll-BamHl. Ainsi, il a ete obtenu trois plasmides: pSPM523 (derive r du 
pUWL201 avec la forme "orflO court" comme insert), pSPM524 (derive du 

15 pUWL201 avec la forme. "orflO long" comme insert) et pSPM525 (derive Uu 
pUWL201 avec la forme "or/10 pro") (Figure 28). 

17.2 Transformation de la souche OS49.50 par les constructions pSPM523, 
pSPM524 et pSPM525 : 

La souche OS49.50 (souche interrompue dans le gene or/10, cf exemple 8) a ete 
20 transformee independamment par transformation de protoplastes (Kieser, T et aL, 2000) 
par chacun des plasmides pSPM523, pSPM524 et pSPM525. Un temoin negatif a 
egalement ete realise en transformant la souche OS49.50 par le plasmide pUWL201 sans 
insert. Apres transfonnation des protoplastes, les clones sont selectionnes pour leuf 
resistance au au thiostrepton. La transfonnation des clones par chacun des plamides est 
25 verifiee par extraction de ces plasmides. Ainsi quatre nouvelles souches ont et6 
obtenues : la souche OSC49.50 pUWL201, issue de la transformation par le plasmide 
pUWL201 sans insert, la souche OSC49.50 pSPM523, issue de la transfonnation par le 
plasmide pSPM523, la souche OSC49.50 pSPM524, issue de la transformation par le 
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plasmide pSPM524 et enfin la souche OS49.50 pSPM525, issue de la transformation par 
le plasmide pSPM525. 

La production de spiramycines de chacune de ces quatre souches a ete testee 
par CLHP. Pour cela, les differentes souches de Streptomyces a tester ont ete 
5 cultivees dans des erlenmeyers a baffles (erlenmeyers chicanes) de 500 ml contenant 
70 ml de milieu MP5 (Pernodet et aL, 1993). Lorsque la souche contient le plasmide 
pUWL201 ou Pun de ses derives, il est ajoute 5 (xg/ml de thiostrepton. Les 
erlenmeyers chicanes ont ete inocules a une concentration initiale de 2.5 10 6 
spores/ml des differentes souches de S. ambofaciens et les cultures ont ete incubees a 

10 27°C sous agitation orbitale de 250 rpm pendant 96 heures. Les cellules ont ensuite 
ete separees du milieu par centrifugation et le surnageant a ete analyse par CLHP (cf. 
exemple 16) pour determiner la quantite de spiramycine produite. Grace a un 
echantillon etalon et a la mesure de Pair des pics, il a ete possible de determiner la 
quantite de chacune des spiramycines produites par ces souches. Les resultats de 

15 cette analyse sont presentes dans le tableau 40, les donnees sont exprimees en mg par 
litre de surnageant. Les resultats correspondent a la production totale en spiramycines 
(obtenue en additionnant la production en spiramycine I, II et III). 

Tableau 40. Production en spiramycines des souches derivees de OS49.50, 
(resultats exprimes en mg/1). 



Souche 


Production en Spiramycines 


OS49.50 
pUWL201. 


0 


OS49.50 
pSPM523 


0 


OS49.50 
pSPM524 


93 
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OS49.50 


149 


pSPM525 





Comme le montre les resultats donnes dans le tableau 40, le temoin negatif 
(souche OS49.50 transformee par le plasmide pUWL201) ne produit pas de 
spiramycins Lorsque le plasmide pSPM523 (qui contient la forme "or/70 court" ) est 
introduit dans la souche OS49.50, aucune production de spiramycine n'est observee. 
5 En revanche, la presence du plasmide pSPM524 (qui contient la forme "or/70 long") 
et du plasmide pSPM525 (qui contient la forme "orflO pro") restaure la production 
de spiramycine dans la souche hote OS49.50. Ainsi, seuls les fragments de or/70 
contenant l'ATG le plus en amont permettent de restaurer la synthese de spiramycine. 

Dans le but de confirmer ces resultats, le plasmide pSPM521 (plasmide 
10 pGEM-T easy contenant la forme "or/70 long") a ete digere par l'enzyme^de 
restriction Xhol (cette enzyme possede un site unique dans ce plasmide, localise entre 
les deux ATG (cf. Figure 28)). Les extremites Xhol ont ensuite ete rendues bout franc 
par traitement a 1' enzyme de Klenow. Le plasmide a alors ete referme sur lui-meme 
par action de la T4 DNA ligase pour donner naissance au plasmide pSPM527.. Si 
15 l'ATG le plus en amont (position 10656 dans la sequence donnee en SEQ ID N° 1) 
est bien utilise comme site d'initiation de la traduction, ce traitement entrainera un 
decalage du cadre de lecture au niveau du site Xhol et aura pour effet la production 
d'une proteine ne presentant pas d'activite activatrice. Par contre si l'initiation de la 
traduction a lieu au niveau de l'ATG plus en aval (position 10809 dans la sequence 
20 donnee en SEQ ID N° 1), ce traitement devrait avoir peu ou pas d' effet sur 
l'expression de OrflO (compte tenu de la localisation du point de demarrage de la 
transcription) et aucun effet sur la proteine produite. 

L'insert BamHl-Hindlll de pSPM527 a ensuite ete sous-clone dans le vecteur 
pUWL201 pour donner naissance au plasmide pSPM528. Ce plasmide a ete introduit 
25 dans la souche OS49.50 et un clone possedant le plasmide voulu a plus 
particulierement ete selectionne. La production de spiramycine de la souche 
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resultante a ensuite ete testee par CLHP (Cf. example 16 et ci-dessus). Contrairernent 
a ce qui avait ete observe avec le plasmide pSPM524 (cf. tableau 40), la presence du 

plasmide pSPM528 dans la souche OS49.-50 ne retablit pas la production de 

spiramycine. Ceci confirme que le demarrage de la traduction du gene orflO est 
5 1 T ATG situe le plus en aval (ATG 1 cf. Figure 28). 

173 Amelioration de la production en spiramycines de la souche OSC2 de S. 
ambo faciens : 

Afin de tester l'effet de la surexpression du gene or/70 sur la production de 

spiramycines, les plasmides pSPM523, pSPM524, pSPM525 et pSPM528 ont ete 

•> . - . 

10 introduits dans la souche OSC2. Pour cela, des protoplastes de la souche OSC2 ont 
ete transformers (Kieser, T et aL> 2000) independamment par chacun des plasmides 
pSPM523, pSPM524, pSPM525 et pSPM528. Un temoin negatif a egalement ete 
realise en transformant la souche OSC2 par le plasmide pUWL201 sans insert. Apres 
transformation des protoplastes, les clones sont selectionnes pour leur resistance au 

15 au thiostrepton. Ainsi cinq nouvelles souches ont ete obtenues : la souche OSC2 
pUWL201 ? issue de la transformation par le plasmide pUWL201 sans insert, la 
souche OSC2 pSPM523, issue de la transformation par le plasmide pSPM523, la 
souche OSC2 pSPM524, issue de la transformation par le plasmide pSPM524, la 
souche OSC2 pSPM525, issue de la transformation par le plasmide pSPM525 et 

20 enfin la souche OSC2 pSPM528 5 issue de la transformation par le plasmide 
pSPM528. La production en spiramycines de ces souches a alors ete analysee par 
CLHP (de la meme maniere que dans l'exemple 17.2). L'analyse de la production en 
spiramycine de la souche OSC2 a egalement ete effectee en parallele pour 
comparaison. Les resultats de cette analyse sont presentes dans le tableau 41 5 les 

25 donnees sont exprimees en mg par litre de surnageant. Les resultats correspondent a 
la production totale en spiramycines (obtenue en additionnant la production en 
spiramycine I, II et III). 
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Tableau 41. Production en spiramycines des souches derivees de OSC2, (resultats 

exprimes en mg/1). 







OSC2 


69 


OSC2 
pUWL201 


103 


OSC2 
pSPM523 


19 


OSC2 
pSPM524 


135 


OSC2 
pSPM525 


278 


OSC2 
pSPM528 


68 



Ainsi, il est observe que la presence du plasmide pSPM524 ou du plasmide 
5 pSPM525 augmente significativement la production en spiramycines de la souche 
OSC2. Ceci demontre bien que la surexpression de OrflO a un effet positif sur la 
production en spiramycines. Le plasmide pSPM528 n'a par contre pas d'effet sur la 
production en spiramycines. 

Les plasmides pSPM525 et pUWL201 ont de la meme maniere ete introduit 
10 dans la souche SPM502 (cf. exemple 14). Ainsi deux nouvelles souches ont ete 
obtenues : la souche SPM502 pUWL201, issue de la transformation par le plasmide 
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pUWL201 sans insert, et la souche SPM502 pSPM525, issue de la transformation par 
le plasmide pSPM525. 

Un echantillon de la souche SPM502 pSPM525 (cette souche contient le plasmide 
pSPM525, cf. ci-dessus) a ete depose aupres de la Collection Nationale de Cultures de 
5 Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur Roux 75724 Paris Cedex 
15, France, le 26 fevrier 2003 sous le numero d'enregistrement 1-2977. 

La production en spiramycines des souches SPM502 pUWL201 et SPM502 
pSPM525 a ete analysee par CLHP (de la meme maniere que dans Fexemple 17.2). 
L 5 analyse de la production en spiramycines de la souche SPM502 a egalement ete 
10 effectee en parallele pour comparaison. Les resultats de cette analyse sont presentes 
dans le tableau 42, les donnees sont exprimees en mg par litre de surnageant. Les 
resultats correspondent a la production en spiramycine L En effet, aucune de ces 
souches ne produit de spiramycine II et III. 

Tableau 42. Production en spiramycine I des souches derivees de SPM502, 
1 5 (resultats exprimes en mg/1). 



Souche 


Spiramycine I 


SPM502 


47 


SPM502 pUWL201 


72 


SPM502 pSPM525 


130 



Ainsi, il a pu etre observe que la surexpression du gene orfl 0 dans la souche 
SPM502 augmente de facon importante la production de spiranxycine I. 
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EXEMPLE 18 : Construction d'une banque d T ADN genomique de la souche OSC2 
de Streptomyces ambofaciens chez K coli dans la cosmide pWED2. 

18.1 Construction du cosmide pWED2 : 

Dans le but de faciliter Pinactivation de genes chez Streptomyces, un 
5 cosmide portant la sequence oriT du plasmide RK2 (ce qui permet son introduction 
par conjugaison dans Streptomyces a partir d'une souche appropriee de E. coli) et 
portant egalement un gene de resistance a un antibiotique conferant un phenotype 
reperable chez Streptomyces, a ete construit. Un tel cosmide contenant de grands 
inserts d'ADN genomique de Streptomyces ambofaciens peut etre utilise dans des 

10 experiences deactivation de genes. 

Pour construire ce vecteur, une cassette pac-oriT (fragment EcoKV) a ete 
introduite dans le cosmide pWEDl (Gourmelen et al, 1998) , derive du cosmide"* 
p WED 15 (Wahl et al, 1987), au niveau du site unique Hpal. La cassette pac-oriT £\ 
ete obtenue par PCR. Pour cela, le gene pac a ete amplifie par PCR a partir du 

15 plasmide pVF 10.4 (Vara et aL, 1985; Lacalle et aL, 1989) en utilisant comme , 
premiere amorce, 1' amorce A (de sequence 5 1 - 

CC AGTAGATATCCCGCC AACCCGGAGCTGCAC-3 ' (SEQ ID N° 126), le site 
de restriction EcoRW a ete souligne et la sequence en gras de 20 nucleotides 
correspond a une region en amont du promoteur du gene pac) et comme deuxieme 

20 amorce, 1' amorce B (de sequence 5 1 - 

GAAAAGATCCGT CATGGGGTCGTGCGCTCCTT-3 1 (SEQ ID N° 127), qui 
corriporte a son extremite 5' une sequence de 12 nucleotides correspondant au debut 
de la sequence oriT (souligne double) et une sequence de 20 nucleotides (en gras) 
correspondant a la fin du gene pac (cf. Figure 29, l 6re PCR). 

25 . Le gene oriT a quant a lui ete amplifie par PCR a partir du plasmide pPM803 

(Mazodier,P. et ah, 1989) en utilisant comme premiere amorce, Pamorce C (de 
sequence S^CACOACCCCATGACGGATCTTTTCCGCTGCAT^ 1 (SEQ ID N° 
128)), qui comporte a son extremite 5' une sequence de 12 nucleotides correspondant a 
une sequence en aval de la sequence codante du gene pac (en gras) et une sequence de 
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20 nucleotides correspondant au debut de la sequence oriT) et comme deuxieme 
amorce, Tamorce D (de sequence 5 ! - 

GAGCCGGATATeATCGGTCTTGCCTTGCTCGT^ 1 (SEQ - EE) N° 129)) qui - 

comporte le site de restriction EcoKV (souligne simple) et une sequence de 20 
5 nucleotides correspondant a la fin de la sequence oriT (souligne double) (cf. Figure 29, 

2 ieme pcR) 

Le produit d'amplification obtenu avec les amorces A et B et celui obtenu avec 
les amorces C et D ont a une de leur extremite, une sequence commune de 24 
nucleotides. Une troisieme PCR a ete realisee en melangeant les deux produits 

10 d'amplification obtenus precedemment et en utilisant comme amorces, les amorces A et 
D (cf figure 29, 3 idme PCR). Ceci a permis d'obtenir un produit d'amplification 
correspondant a V ensemble pac+oriT. Ce fragment pac-oriT a alors ete clone dans le 
vecteur pGEM-T Easy (commercialise par la societe Promega (Madison, Wisconcin, , 
USA)), ce qui a permis d'obtenir le plasmide pGEM-T-pac~oriT. L'insert de ce 

15 plasmide a ensuite ete sous clone dans le cosmide pWEDL Pour cela le plasmide 
pGEM-pac-oriT a ete digere par r enzyme EcoRV et 1'insert EcoRV contenant 
Tensemble pac+oriT a ete insere dans le cosmide pWEDl ouvert au prealable par 
l 5 enzyme Hpal, Le cosmide ainsi obtenu a ete baptise pWED2 (cf Figure 30). 

Ce cosmide permet de faciliter 1'inactivation de genes chez Streptomyces. 

20 En effet, il porte la sequence oriT (ce qui permet son introduction par conjugaison 
dans Streptomyces a partir d'une souche appropriee de E. coli) mais egalement un 
gene de resistance a un antibiotique conferant un phenotype reperable chez 
Streptomyces. Un tel cosmide contenant de grands inserts d'ADN genomique de 
Streptomyces ambofaciens peut etre utilise dans des experiences deactivation de 

25 genes. 

Ainsi un cosmide derive de pWED2 contenant le gene cible pourra par 
exmeple etre introduit dans la souche de E. coli KS272 contenant le plasmide 
pKOBEG (cf Chaveroche et al. 2000) et une cassette sera introduite dans le gene 
cible selon la technique decrite par Chaveroche et al. 2000. Le cosmide obtenu par 
30 cette technqiue (cosmide dans lequel le gene cible est inactive), pourra ensuite etre 
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introduit dans une souche de E. coli telle que la souche SI 7.1 ou toute autre souche 
permettant de transferer par conjugaison des plasmides contenant la. sequence oriT 
vers Streptomyces. 

Apres conjugaison entre E. coli et Streptomyces, des clones de Streptomyces 
5 dans lesquelles la copie sauvage du gene cible aura ete remplacee par la copie 
interrompue pourront etre obtenues comme decrit dans Pexemple 2. 

Le gene de resistance exprime chez Streptomyces present sur ce nouveau 
cosmide est le gene pac de Streptomyces alboniger (Vara, J et al, 1985 ; Lacalle et 
ah, 1 989) qui code la puromycine N-acetyl transferase et qui confere la resistance a la 
10 puromycine. Lors d'experiences deactivation de gene, on cherchera les clones dans 

lesquels un double evenement de recombinaison aura eu lieu. Ces clones auront & 
eliminer le cosmide pWED2 et seront done redevenus sensibles a la puromycine^ _ . ■> 

,; v .* 

18.2 Construction d'une banque d'ADN genomique de la souche OSC2 de 

■* . * c 

Streptomyces ambofaciens chez E. coli dans le cosmide pWED2 r 

15 L'ADN genomique de la souche OSC2 de Streptomyces ambofaciens a ete : 

digere partiellement par T enzyme de restriction BamRl de maniere a obtenir des ^ 
fragments d'ADN de taille comprise entre environ 35 et 45 kb. Ces fragments ont ;± 
ensuite ete clones dans le cosmide pWED2, ce dernier ayant ete au prealable digere par 
BamHl, puis traite par la phosphatase alcaline. Le melange de ligation a ensuite etc 

20 encapside in vitro dans des particules de phages lambda grace au systeme « Packagene® 
Lambda DNA packaging system » commercialise par la societe Promega (Madison, 
Wisconcin, USA) en suivant les recommandations du fabriquant Les particules 
phagiques obtenues ont ete utilisees pour infecter la souche SUKE® d 9 E. coli 
commercialism par la societe Stratagene (LaJolla, Californie, USA). La selection des 

25 clones a ete effectuee sur milieu LB + ampicilline (50 |xg/ml) 3 le cosmide pWED2 
conferant la resistance a Tampicilline. 
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EXEMPLE 19 : Isolement de cosmides de la nouvelle banque couvrant la region de 
la voie de biosynthese des spiramycines 

19.1 Hybridation sur colonies de la banque genomique de Streptomvces 
ambofaciens OSC2 : 

Des cosmides de la nouvelle banque de Streptomyces ambofaciens OSC2 (cf. 
exemple 1 8) couvrant les orfl * a or/70* ou une partie ou la totalite des orfl a orfl 5 c, 
ou une region plus en amont de Vorf25c ont ete isoles. Pour cela 5 des hybridations 
successives sur les colonies d*E. coli obtenues selon Pexemple 18 ont ete realisees en 
utilisant les 3 sondes suivantes (cf. figure 31): 

- La premiere sonde utilisee correspond a un fragment d'ADN d'environ 0 5 8kb 
amplifie par PCR en utilisant comme matrice le cosmide pSPM5 et les amorces 
suivantes : 

ORF23c: 5 f - ACGTGCGCGGTG AGTTCGCCGTTGC-3 ! (SEQ ID N° 130) et 
ORF25c : 5 f -CTGAACGACGCC ATCGCGGTGGTGC-3 1 (SEQ IDN° 131). 
Le produit de PCR ainsi obtenu contient un fragment du debut de Vorf23c, Vorf24c en 
entier et la fin de V orfl 5c (c£ figure 31, sonde I). 

- La deuxieme sonde utilisee correspond a un fragment d ! ADN d'environ 0,7kb 
amplifie par PCR en utilisant comme matrice TADN total de la souche S. 
ambofaciens ATCC23877 et les amorces suivantes : 

ORFl*c: S'-GACCACCTCGAACCGTCCGGCGTCA-S' (SEQ ID N° 132) et 
ORF2*c : S^GGCCCGGTCCAGCGTGCCGAAGC-S' (SEQ ID N° 133). 
Le produit de PCR ainsi obtenu contient un fragment de la fin de 1 'orfl *c et du debut 
de 1 y orf2 *c (cf. figure 3 1 , sonde II). 



- La troisieme sonde utilisee correspond a un fragment EcoRl-BamHl d'environ 3kb 
contenant les orfl, orf2 et orf3 et obtenu par digestion du plasmide pOS49.99 (cf figure 
31, sonde ID). 
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Environ 2000 clones de la banque obtenue dans l'exeraple 18.2 ont ete transferes 
sur filtre pour hybridation sur colonies selon les techniques classiques (Sambrook et al, 
1989). 

La premiere sonde (cf. figure 31, sonde I) a ete marquee au 32 P par la technique 
du « random priming » (Kit commercialise par la societe Roche) et utilisees pour 
l'hybridation sur 2000 clones de la banque, apres transfert sur filtre. L'hybridation a ete 
effectuee a 65°C dans le tampon decrit par Church & Gilbert (Church & Gilbert, 1984). 
Deux lavages ont ete effectues en 2x SSC, 0,1% SDS a 65°C, le premier pendant 10 
minutes et le deuxieme pendant 20 minutes et un troisieme lavage d'une duree de 30 
minutes a ensuite ete effecrue en 0.2X SSC, 0,1% SDS a 65°C. Dans ces conditions 
d'hybridation et de lavage, 20 clones parmi les 2000 hybrides presentaient un fort signal 
d'hybridation avec la premiere sonde. Ces 20 clones ont ete cultives en milieu LB+ 
ampicilline (50 ug/ml) et les 20 cosmides correspondants ont ete extraits par lyse 
alcaline (Sambrook et al, 1989) puis ils ont ete digeres par l'enzyme de restriction 
BamUl. Les produits de digestions ont ensuite ete separes sur gel d'agarose, transferes 
sur membrane de Nylon et hybrides par la premiere sonde (cf. ci-dessus : le produit de 
PCR ORF23c-ORF25c, sonde I) dans les memes conditions que ci-dessus. Douze 
cosmides possedaient un fragment Bamm hybridant fortement avec la sonde utilisee. 
Ces 12 cosmides ont ete nommes pSPM34, pSPM35, pSPM36, pSPM37, pSPM38, 
pSPM39, pSPM40, pSPM41, pSPM42, pSPM43, pSPM44 et pSPM45. Les profils, 
apres digestion par BamHl, de ces 12 cosmides ont ete compares entre eux et avec celui 
du cosmide pSPM5. De plus des experiences d'amplification par PCR en utilisant 
differentes amorces correspondant a differents genes deja identifies dans la region orfl- 
orj25c ont permis de positionner l'insert de certains de ces cosmides les uns par rappOrt 
aux autres et de determiner egalement la localisation de ces inserts dans la region orfl^ 
orf25c deja connue (cf. Figure 32). Le cosmide pSPM36 a plus particulierement ete 
choisi car il etait susceptible de contenir une grande region en amont de Vorf25c (cf. 
Figure31 et 32). 
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Dans un deuxieme temps, et en utilisant les memes conditions que celles 
decrites ci-dessus, les 2000 clones de la banque de Streptomyces ambofaciens OSC2 ont 
ete hybrides avec la deuxieme sonde correspondant au produit de PGR : ORFl*c- 
ORF2*c (cf. figure 31, sonde II). Cette hybridation a permis d'isoler des cosmides dont 
Finsert est situe dans la region de orfl*c a orfl0*c. Dans les conditions d'hybridation 
utilises, 16 clones parmi les 2000 hybrides presentaient un fort signal d'hybridation avec 
cette deuxieme sonde. Ces 16 clones ont ete cultives en milieu LB+ ampicilline (50 
|ig/ml) et les 16 cosmides correspondants ont ete extraits par lyse alcaline (Sambrook et 
aL> 1989) puis ils ont ete digeres par 1' enzyme de restriction BcuriHL Les profils de 
digestion (apres digestion par BamHI) de ces 16 cosmides ont ete compares entre eux et 
avec celui du cosmide pSPM7. Des experiences d'amplication par PCR avec les 
amorces ORFl*c et ORF2*c ont permis de choisir deux cosmides qui renfermaient bien 
les genes orfl*c et orf2*c et dont les profils possedaient des bandes communes mais 
aussi des bandes differentes. De plus d'autres experiences d' amplification par PCR en 
utilisant differentes amorces correspondant a differents genes deja identifies dans la 
region orfl*c a orfl0*c ont permis de positionner Tinsert de ces cosmides les uns par 
rapport aux autres et de determiner egalement la localisation de ces inserts dans la region 
orfl*c a orfl0*c deja connue (cf. Figure 32). Les deux cosmides plus particulieremtot 
selectionnes ont ete nommes pSPM47 et pSPM48 (cf. Figure 32). 

En utilisant les memes conditions que celles decrites ci-dessus, les 2000 clones 
de la banque de Streptomyces ambofaciens OSC2 ont egalement ete hybrides avec la 
troisieme sonde correspondant au fragment d'ADN EcoRl-BamHl du plasmide 
pOS49.99 (cf. figure 31 sonde HI). Cette hybridation a permis d'isoler les cosmides 
contenant la region de Vorfl jusqu'a VorfS et susceptibles de contenir soit une grande , 
partie des genes des PKS, soit une grande partie des genes orfl a orf25c de la voie de ; 
biosynthese des spiramycines. Dans ces conditions d'hybridation, 35 clones parmi les 
2000 hybrides presentaient un fort signal d'hybridation avec la troisieme sonde. Ces 35 
clones ont ete cultives en milieu LB+ ampicilline (50 ^tg/ml) et les 35 cosmides 
correspondants ont ete extraits par lyse alcaline (Sambrook et al, 1989) puis digeres par 
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r enzyme de restriction BamHl. Les profils, apres digestion par BamKl, de ces 35 
cosmides ont ete compares entre eux et avec celui du cosmide pSPMS. De plus des 
experiences d' amplification par PCR en utilisant differentes amorces correspondant a 
differents genes deja identifies dans la region orfl a orf25c ont permis de verifier que 
5 ces cosmides renfermaient bien des inserts provenant de la region orfl a orf25c et de 
positionner les inserts de ces cosmides les uns par rapport aux autres et par rapport a la 
la region orfl a orf25c deja connue (cf. Figure 32), Cinq cosmides ont ete plus 
particulierement selectionnes, ils ont ete nommes pSPMSO, pSPMS 1 , pSPM53, pSPM55 
et pSPM56 (cf. Figure 32). 

10 19.2 Sous clonage et sequencage d'une partie de Pinsert du cosmide pSPM36. 

La sonde d'environ 0,8 kb obtenue par PCR avec les amorces ORF23c et ORF25c 
(cf. ci-dessus et figure 31, sonde I) a egalement ete utilisee dans des experiences de 
Southern Blot sur FADN total de S. ambofaciens OSC2 digere par F enzyme Pstl. Dans 
les conditions d'hybridation decrite ci-dessus, cette sonde revele un fragment unique 

15 Pstl d'environ 6 kb lorsque hybride sur FADN total de S. ambofaciens OSC2 digere par 
F enzyme Pstl, II existe un site Pstl au niveau de Vorf23c (cf. SEQ ID N° 80) mais aucun 
autre site Pstl jusqu'a Pextremite (site BamHT) de la sequence connue (cf. SEQ ID N° 
1). Ce fragment PstVBamHl a une taille d'environ 1.4 kb. Le fragment Pstl de 6 kb 
hybride sur FADN total de S. ambofaciens digere par F enzyme Pstl contient done une 

20 region d'environ 4,6 kb situee en amont de orf25c, Cette region est susceptible de 
contenir d'autres genes dont les produits sont impliques dans la voie de biosynthese de 
la spiramycine. II a ete verifie par digestion que le cosmide pSPM36 contenait bien ce 
fragment Pstl de 6 kb. Ce fragment a ete isole a partir de pSPM36, dans le but de 
determiner la sequence plus en amont de orf25c. Pour cela, le cosmide pSPM36 a ete 

25 digere par F enzyme de restriction Pstl. Le fragment Pstl-Pstl d'une taille d'environ 6kb 
a ete isole par electroelution a partir d'un gel d'agarose 0.8% puis clone dans le vecteur 
pBK-CMV (4512bp) (commercialise par la societe Stratagene (La Jolla, Californie, 
USA)). Le plasmide ainsi obtenu a ete nomme pSPM58 (cf. Figure 33) et la sequence de 
son insert a ete determines La sequence de cet insert est presentee eri SEQ ID N° 134. 
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Toutefois, toute la sequence n'a pas ete determinee et il subsite un trou d'environ 450 
nucleotides, la partie de la sequence non determinee a ete notee par une succession de 
« N » dans la sequence correspond ante. - - 

19.3 Analyse des n ouv elle s s equences nucleotidiques. determination des p hases 
ouvertes de lecture et caracterisa t ion des genes impliq ue s dans la biosvnthese des 
spiramveines. 

La sequence de Pinsert du cosmide pSPM58 obtenue a ete analysee grace au 
programme FramePlot (Ishikawa J & Hotta K. 1999). Ceci a permis d'identifier, parmi 
les phases ouvertes de lecture, les phases ouvertes de lecture presentant un usage des 
codons typique de Streptomyces. Cette analyse a permis de determiner que cet insert 
comporte 4 nouvelles ORFs en amont de Vorf25c (cf. figure 34). Ces genes ont ete 
nommes or/26 (SEQ ID N° 107), or/27 (SEQ ID N° 109), orf28c (SEQ ID N° 111, la 
sequence de cette orf n'a pas ete determinee complement puisqu'un trou d'environ 450 
nucleotide subsite lors du sequencage de l'insert de pSPM58, ces 450 nucleotides 
figurent sous la forme d'une sere de « N » dans la sequence SEQ ID N° 1 1 1) et or/29 (la 
sequence de cette derniere orf etait incomplete dans cette insert). Le « c » ajoute dans le 
nom du gene signifiant pour l'ORF en question que la sequence codante est dans 
1'orientation inverse (cf. figure 34). 

Les sequences proteiques deduites de ces phases ouvertes de lecture ont ete 
comparees avec celles presentes dans differentes bases de donnees grace a differents 
programmes : BLAST (Altschul et al, 1990) (Altschul et ah, 1997), CD-search, (ces 
deux programmes sont accessibles notamment aupres du National Center for 
Biotechnology Information (NCBI) (Bethesda, Maryland, USA)), FASTA ((Pearson W. 
R & D. J. Lipman, 1988) et (Pearson W. R., 1990) (ce programme est accessible 
notamment aupres du centre de ressources INFOBIOGEN, Evry, France). Ces 
comparaisons ont permis de formuler des hypotheses sur la fonction des produits de ces 
genes et d'identifier ceux susceptibles d'etre impliques dans la biosynthese de 
spiramycines. 
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19A Sous clonage et secmencag e d'une autre nartie de l'insert du cosmide 
pSPM36. 

La sonde d' environ 0,8 kb obtenue par PCR avec les amorces ORF23c et ORF25c 
(cf. ci-dessus et figure 31, sonde I) a egalement ete utilisee dans des experiences de 
Southern Blot sur l'ADN total de la souche OSC2 digere par 1' enzyme Stul. Dans les 
conditions d'hybridation decrite ci-dessus pour cette sonde, cette sonde revele un 
fragment unique Stul d'environ 10 kb lorsque hybride sur l'ADN total de la souche 
OSC2 digere par 1' enzyme Stul. Compte tenu de la presence d'un site Stul dans Vorf23c 
(cf. SEQ ID N° 80) et de la localisation de ce site par rapport au site Pstl, ce fragment 
de 10 kb inclut la totalite du fragment Pstl precedemment etudie (insert de pSPM58) et 
permet d' avoir acces a une region non encore etudiee d'environ 4 kb. (cf figure 33). H a 
ete verifie par digestion que le cosmide pSPM36 contenait bien ce fragment Stul de 10 
kb. Ce fragment a ete isole a partir du cosmide pSPM36, dans le but de determiner la 
sequence de la fin &orf29 et d'autres genes plus en amont de or/29. Pour cela, le 
cosmide pSPM36 a ete digere par l'enzyme de restriction Stul Le fragment Stul-Stul 
d'une taille d'environ 10 kb a ete isole par electroelution a partir d'un gel d'ag'arose 
0.8% puis clone dans le vecteur pBK-CMV (4512bp) (commercialise par la societe 
Stratagene (La Jolla, Califomie, USA)). Le plasmide ainsi obtenu a ete nomme pSPM72 
(cf. Figure 33). Ce dernier a ensuite ete digere par EcoKL (site EcdRl dans l'insert de 
pSPM58) et Hin&m (site Hincim dans le site de clonage multiple du vecteur, 
immediatement apres le site Stul de l'extremite de l'insert) (cf. Figure 33). Le fragment 
d'ADN EcoRl-HindTll ainsi obtenu, correspond a un fragment de l'insert du plasmide 
pSPM72 (cf. figure 33) et a ete sous-clone dans le vecteur pBC-SK+ (commercialise par 
la societe Stratagene (La Jolla, Californie, USA)) digere au prealable par EcoW et 
HindlH. Le plasmide ainsi obtenu a ete nomme pSPM73 et la sequence de son insert a 
ete determinee. La sequence de cet insert est presentee en SEQ ED N° 135. 
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19.5 Analyse des nouvell es sequences nucleotidiques. de te rmination des phases 
ouvertes de lecture et caracteri s ation des genes impliques dans la biosvnthese des 
- spiramycines. - - — ■- - ■— - - - - -•- 

La sequence partielle de l'insert du cosmide pSPM73 obtenue a ete analysee grace 
au programme FramePlot (Ishikawa J & Hotta K. 1999). Ceci a permis d'identifier, 
parmi les phases ouvertes de lecture, les phases ouvertes de lecture presentant un usage 
des codons typique de Streptomyces. Cette analyse a permis de determiner que cet insert 
comporte 4 ORFs, une incompletes et trois completes (cf. figure 34). L'ORF incomplete 
correspond a la partie 3' de la sequence codante de or/29 ce qui a permis de completer la 
sequence de ce gene grace a la sequence partielle de ce meme orf obtenue lors du 
sequencage de l'insert du plasmide pSPM58 (cf. exemple 19.2 et 19.3), 1'ensemble des 
deux sequences a ainsi permis d'obtenir la sequence complete de or/29. Les 4 genes ont 
ainsi ete nommes or/29 (SEQ ID N° 1 13), orfiOc (SEQ ED N° 115), or/31 (SEQ ED N° 
1 18) et or/3 2c (SEQ ID N° 120). Le « c » ajoute dans le nom du gene signifiant pour 
l'ORF en question que la sequence codante est dans Porientation inverse (cf. figure 34). 

Les sequences proteiques deduites de ces phases ouvertes de lecture ont ete 
comparees avec celles presentes dans differentes bases de donnees grace a differents 
programmes : BLAST (Altschul et ah, 1990) (Altschul et al, 1997), CD-search, (ces 
deux programmes sont accessibles notamment aupres du National Center for 
Biotechnology Information (NCBI) (Bethesda, Maryland, USA)), FASTA ((Pearson W. 
R & D. J. Lipman, 1988) et (Pearson W. R., 1990) (ce programme est accessible 
notamment aupres du centre de ressources INFOBIOGEN, Evry, France). Ces 
comparaisons ont permis de formuler des hypotheses sur la fonction des produits de ces 
genes et d'identifier ceux susceptibles d'etre impliques dans la biosynthese de 
spiramycines. 
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EXEMPLE 20 : Analyse de la production d'intermediaires de biosynthese de 
spiramycins : 

20.1 Preparation des echantillons : 

Les differentes souches a tester ont ete cultivees chacune dans 7 erlenmeyers 
5 chicanes de 500 ml contenant 70 ml de milieu MPS (Pemodet et al., 1993). Les erlens 
ont ete inocules par 2.5 10 6 spores/ml des differentes souches de 5. ambofaciens et 
mises a pousser a 27°C sous agitation orbitale de 250 rpm pendant 96 heures. Les 
cultures correspondant au meme clone sont rassemblees, eventuellement filtrees sur 
filtre plisse, et centrifugees 1 5 rnin a 7000 tr/min. 
10 Le pH du mout est ensuite ajuste a 9 avec de la soude et le surnageant est extrait 

par de la methyl iso-butyryl cetone (MIBK). La phase organique (MIBK) est alors 
recuperee et evaporee. L'extrait sec est ensuite repris dans 1ml d'acetonitrile, puis diliie 
au 1/10 (IOOjlxI qsp 1ml avec de l'eau) avant d'etre utilise pour les analyses ^eri 
chromatographic liquide couplee a la spectrometrie de masse (CL/SM). 

20.2 Analyse des echantillons en CL/SM ; 

Les echantillons ont ete analyes en CL/SM dans le but de determiner la masse des 
differents produits synthetises par les souches a tester. 

La colonne de chromatographic liquide haute performance utilisee est une 
20 colonne Kromasil C8 1 50*4 3 6mmm, 5mmm, 100A. 

La phase mobile est un gradient constitue d'un melange d'acetonitrile et d'une solution 
aqueuse d'acide trifluoroacetique a 0.05%, le debit est fixe a 1 ml/min. La temperature 
du four colonne est maintenue a 30°C. 

La detection UV en sortie de la colonne a ete effectuee a deux longueurs d'onde 
25 differentes : 238 ran et 280 ran. 

Le spectrometre de masse couple a la colonne de chromatographic est un appareil 
Simple Quadripole commercialise par la societe Agilent, avec des tensions de cone a 30 
et a 70V. 
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20.3 Analyse d es intermediates de biosvnthese produits par la souche OS49.67 : 

La souche OS49,67 dans laquelle le gene or/3 est inactive par une deletion en 
phase ne produit pas de spiramycines (cf exemple 6 et 15). 

Un echantillon a ete prepare selon la methode decrite ci-dessus (cf paragraphe 20.1) et 
a ete analyse par CL/SM corame decrit ci-dessus (cf. le paragraphe 20.2). 
Plus particulierement, Panalyse par chromatographie a ete realisee en gradient de : 
solvant avec comme phase mobile : 20% d'acetonitrile du temps T=0 a 5min puis 
montee lineaire a 30% a T=35 minutes, suivie d'un palier jusqu'a T=50 minutes. 

Dans ces conditions, deux produits ont plus particulierement ete observes : uri : 
absorbant a 238 nm (temps de retention de 33.4 min) et un absorbant a 280 nm (temps 
de retention de 44.8 min) (cf. figure 35). La figure 35 montre la superposition des 
chromatogrammes CLHP realises a 238 et 280nm (haut) ainsi que les spectres UV des 
molecules elues a 33,4 minutes et 44,8 minutes (bas). 

Les conditions d'analyses en spectrometrie de masse couplee etaient les suivantes 
: le balayage se fait en mode scan, couvrant une gamme de masse comprise entre 100 et 
1000 Da. Le gain de 1'electro-multiplicateur etait de IV. Concernant la source 
electrospray, la pression du gaz de nebulisation etait de 35 psig, le debit du gaz sechant : 
de 12.0 l.min" \ la temperature du gaz sechant de 350°C, la tension du capilaire etait 
portee a +/- 3000 V. Ces experiences ont permis de determiner la masse des deux 
produits separes. Ces masses sont respectivement de 370 g/mole pour le produit elue en 
premier ([M-H 2 0] + =353 produit majoritaire) et 368 g/mole pour le second produit ([M- 
H 2 0] + =3 5 1 produit maj oritaire) . 

Afin d'obtenir la structure, les produits mentionnes ci-dessus ont ete isoles et 
purifies dans les conditions suivantes : la phase mobile est un melange d'une solution 
aqueuse d'acide trifluoroacetique a 0.05% et d'acetonitrile 70/30 (v/v). La 
chromatographic est realisee en regime isocratique avec un debit fixe de 1 ml/min. Dans 
ces conditions, les temps de retention des 2 produits sont respectivement de 8 et 13.3 
minutes. De plus dans ce cas, V echantillon prepare (cf. paragraphe 20.1) n'est pas dilue 
dans l'eau avant injecton de lOpl 
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Les 2 produits sont recuperes a la sortie de la colonne chromatographique et isoles 
dans les conditions suivantes : une cartouche Oasis HLB 1 cc 30mg (Waters) est 
conditionnee sequentiellement par 1 ml d'acetonitrile, puis 1 ml d'eau/acetonitrile 
(20v/80v) et 1ml d'eau/ac&onitrile 80/20. L'echantillon est ensuite introduit et la 
5 cartouche lavee successivement par 1 ml d'eau/acetonitrile (95/5), 1ml 
d'eau/acetonitrile deutere (95/5), puis eluee avec 600ul d'eau/acetonitrile deutere 40/60. 
La solution recuperee est ensuite directement analysee en RMN. 

Les spectres RMN obtenus pour ces deux composes sont les suivants : 

10 - Premier produit elue: Platenolide A: (Spectre 9646V) 

Spectre 1H dans CD3CN (deplacements chimiques en ppm): 0,90 (3H, t, J=6Hz), 0,93 
(3H, d, J— 5Hz), 1,27 (3H, d, J=5Hz), entre 1,27 et 1,40 (3H, m), 1,51 (1H, m), 1,95 
(1H, m), 2,12 (1H, m), 2,30 (1H, d, J=12Hz), 2,50 (1H, d, J=llHz), 2,58 (1H, dd> J=9 
et 12 Hz), 2,96 (1H, d, J=7Hz), 3,43 (3H, s), 3,70 (1H, d, J=9Hz), 3,86 (1H, d, J==7Hz), 

15 4,10 (1H, m), 5,08 (1H, m), 5,58 (1H, dt, J=3 et 12Hz), 5,70 (1H, dd, J=8 et 12 Hz), 
6,05 (1H, dd, J=9 et 1 2 Hz), 6,24 (1H, dd, J=9 et 12Hz). 

-Deuxieme produit elue: Platenolide B: (Spectre 9647V) 

Spectre 1H dans CD3CN (deplacements chimiques en ppm): 0,81 (3H, t, J=6Hz), 0,89 
20 (1H, m), 1,17 (3H, d, J=5Hz), 1,30 (4H, m), 1,47 (2H, m), 1,61 (1H, t, J=10Hz), 2,20 
(1H, m), 2,38 (1H, d, J=13Hz), 2,52 (1H, m), 2,58 (1H, m), 2,68 (1H, dd, J=8 et 13Hz), 
3,10 (1H, d, J=7Hz), 3,50 (3H, s), 3,61 (1H, d, J=8Hz), 3,82 (1H, d, J=7Hz), 5,09 (1H, 
m), 6,20 (1H, m), 6,25 (1H, dd, J=9 et 12 Hz), 6,58 (1H, d, J=12 Hz), 7,19 (1H, dd,. J=9 
et 12Hz). 



Ces experiences ont ainsi permis de determiner la structure de ces deux composes. 
Le premier produit elue est le platenolide A et le deuxieme est le platenolide B, la 
structure deduite de ces deux meolecules est pr6sentee en figure 36. 



30 
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20.4 Analyse des intermediaires de biosynthese produits par la souche SPM509 : 

La souche SPM509 dans laquelle le gene orfl4 est inactive (orfI4:;att3i2aac-) ne 
produit pas de spiramycines (cf exemple 13," 15 et 16). Un echantillon a 6t6 prepare 
selon la methode decrite ci-dessus (cf. paragraphe 20.1) et a ete analyse par CL/SM 
comme decrit ci-dessus (cf. le paragraphe 20.2 et 20.3). L'analyse des intermediaires de 
biosynthese presents dans le surnageant de culture de la souche SPM509 cultivee en 
milieu MP5 a montre que cette souche ne produisait que la forme B du platenolide 
(« platenolide B », cf. figure 36) mais pas la forme A (« platenolide A » ? cf. figure 36). 



EXEMPLE 21: Interruption du gene or/14 dans une souche interrompue dans le 
gene orf3 (OS49.67) 

Le produit du gene orfl4 est indispensable a la biosynthese des spiramycines 
(cf. exemple 13, 15 et 16 : la souche SPM509 dans laquelle ce gene est interrompu ne 
produit plus de spiramycines). L'analyse des intermediaires de biosynthese presents 
dans le surnageant de culture de la souche SPM509 cultivee en milieu MPS a montre 
que cette souche ne produisait que la forme B du platenolide mais pas la forme A (cf. 
exemple 20). Une des hypotheses pouvant expliquer cette observation est que le 
produit de orfl4 soit implique dans la conversion de la forme B du platenolide en 
forme A par une etape enzymatique de reduction. Pour tester cette hypothese, le gene 
or/74 a ete inactive dans un mutant ne produisant plus de spiramycine, mais 
produisant les formes A et B du platenolide. C'est le cas de la souche OS49.67 (cf. 
exemple 6 et 20) dans laquelle le gene or/3 est inactive par une deletion en phase 
(Aor/3). Pour inactiver le gene orfl4 dans cette souche le plasmide pSPM509 a ete 
introduit par transformation de protoplastes de la souche OS49.67 (Kieser, T et al, 
2000). L'inactivation du gene orfl4 a deja ete decrite dans le cas de la souche OSC2 
(cf exemple 13) et il a ete procede de la meme maniere pour l'inactivation du gene 
orfl4 dans la souche OS49.67. Apres transformation par le plasmide pSPM509, les 
clones sont selectionnes pour leur resistance a Tapramycine. Les clones resistants a 
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Papramycine sont ensuite repiques respectivement sur milieu avec apramycine et sur 
milieu avec hygromycine. Les clones resistants a l'apramycine (ApraR) et sensibles a 
l'hygromycine (HygS) sont en principe ceux ou un double evenement de crossing 
over s'est produit et dans lesquels le gene or/74 a ete remplace par une copie de orf!4 
interrompue par la cassette attiQaac-. Ces clones ont ete plus particulierement 
selectionnes et le remplacement de la copie sauvage de orfl4 par la copie 
interrompue par la cassette a ete verifie par hybridation. Ainsi, l'ADN total des 
clones obtenus, a ete digere par plusieurs enzymes, separe sur gel d'agarose, transfere 
sur membrane et hybride avec une sonde correspondant a la cassette attSQaac- pour 
verifier que le remplacement de gene avait bien eu lieu. La verification du genotype 
peut egalement etre realisee par toute methode connue de l'homme du metier et 
notamment par PCR en utilisant les oligonucleotides appropries et sequencage du ; 
produit PCR. 

Un clone presentant les caracteristiques attendues (Aor/3, orfl4::att3Qaac-) a 
ete plus particulierement selectionne et nomine SPM510. II a pu en effet etre verifie 
grace aux deux hybridations que la cassette att3Qaac- etait bien presente dans le 
genome de ce clone et que l'on obtient bien le profil de digestion attendu dans le cas 
d'un remplacement, a la suite d'un double evenement de recombinaison, du gene 
sauvage orf!4 par la copie interrompue par la cassette attSQaac- dans le genome de 
ce clone. 



EXEMPLE 22 : Complementation fonctionneUe de l'interruption du gene orfl4 

22.1 Construction du plasmide pSPM519 : 

Le gene orfl4 a ete amplifie par PCR en utilisant le couple d' oligonucleotides 
suivant : EDR31 : 5' CCCAAGCTTCTGCGCCCGCGGGCGTGAA 3' (SEQ ID N° 

136) et EDR37 : 5' GCTCTAGAACCGTGTAGCCGCGCCCCGG 3' (SEQ ID N° 

137) et comme matrice l'ADN chromosomique de la souche OSC2. Les 
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oligonucleotides EDR31 et EDR37 portent respectivement le site de restriction 
HindlE et Xbal (sequence en gras). Le fragment de 1,2 kb ainsi obtenu a ete clone 
dans le vectcur pGEM-T easy (commercialise par- la societe Promega (Madison, 
Wisconcin, USA)) pour donner naissance au plasmide pSPM515._Ce plasmide a 
ensuite ete digere par les enzymes de restriction Hindm et Xbal. L'insert 
HindmiXbal de 1,2 kb obtenu a ete clone dans le vecteur pUWL201 (cf. exemple 
17.1) prealablement digere par les raemes enzymes. Le plasmide ainsi obtenu a ete 
nommepSPM519. 

22.1 Transformation des sou ches SPM509 et SPM510 par le p lasmide 
PSPM519 : 

Le plasmide pSPM519 a ete introduit dans les souches SPM509 (cf. exemple 
13) et SPM510 (cf. exemple 17) par transformation de protoplastes (Kieser, T et al, 
2000). Apres transformation, les clones sont selectionnes pour leur resistance au 
thiostrepton. Les clones sont ensuite repiques sur un milieu contenant du 
thiostrepton. 

La souche SPM509 est une souche non productrice de spiramycines (cf. 
exemple 13, 15 et 16 et figure 24). La production en spiramycines de la souche 
SPM509 transformee par le vecteur pSPM519 (souche nommee SPM509 pSPM519) 
a ete analysee en cultivant cette souche dans du milieu MP5 en presence de 
thiostrepton. Les surnageants de culture ont ensuite ete analyses par CLHP (cf. 
exemple 16 et 17). Les resultats de cette analyse sont presenter dans le tableau 43, les 
donnees sont exprimees en mg par litre de surnageant. Les resultats correspondent a 
la production totale en spiramycines (obtenue en additionnant la production en 
spiramycine I, II et III). II a ete observe que la presence du vecteur pSPM519 dans la 
souche SPM509 restaure la production de spiramycines (cf. tableau 43). 
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Tableau 43. Production en spiramycines de la souche SPM509 transformee par le 
vecteur pSPM519, (resultats exprimes en mg/1 de sumageant). 



Souche 


Production en spyramicines 


SPM509 pSPM519 


58 



La souche SPM510 transformee par le plasmide pSPM519 a ete nominee 
5 SPM510pSPM509. 

EXEMPLE 23 : Complementation fonctionnelle de ^interruption du gene or/3 
par le gene tylB de S. fradiae 

t r 

23.1 Construction du plasmide pOS49.52 : v. 

10 - Le plasmide pOS49.52 correspond a un plasmide permettant P expression de 

la proteine TylB chez S. ambofaciens. Pour le construire, la sequence codante du 
gene tylB de S. fradiae (Merson-Davies & Cundliffe, 1994, numero d'acces 
GenBank: U08223 (sequence de la region), SFU08223 (sequence ADN). et 
AAA21342 (sequence proteique)) a ete introduite dans le plasmide pKC1218. 

15 (Bierman et al, 1992, Kieser ei aL, 2000, une souche de E. coli contenant ce 
plasmide est accessible notamment aupres de PARS (NRJRL) Agricultural Research 
Service Culture Collection) (Peoria, Illinois, USA), sous le numero B-14790). De 
plus cette sequence codante a ete placee sous le controle du promoteur ermE* (cf. ci-r 
dessus, notamment exemple 17.1, Bibb etal, 1985, Bibb et al., 1994). 

20 23.1 Transformation de la souches OS49.67 par le plasmide pOS49.52 : 

La souche OS49.67 dans laquelle le gene or/3 est inactive par une deletion en 
phase ne produit pas de spiramycines (cf. exemple 6 et 15). Le plasmide pOS49.52 a 
ete introduit dans la souche OS49.67 par transformation de protoplastes (Kieser, T et 
al, 2000). Apres transformation, les clones sont selectionnes pour leur resistance a 
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l'apramycine. Les clones sont ensuite repiques sur un milieu contenant de 
l'apramycine. Un clone a ete plus particulierement selectionne et a ete nonraie 
OS49.67pOS49.52v~ 

Comme il a ete demontre ci-dessus, la souche OS49.67 ne produit pas de 
5 spixamycines (cf. exemple 6 et 15). La production en spiramycins de la souche 
OS49.67 transformee par le vecteur pOS49.52 a ete analysee par la technique decrite 
dans r exemple 1 5. II a ainsi pu etre demontre que cette souche possede un phenotype 
producteur de spiramycines. Ainsi la proteine TylB permet la complementation 
fonctionnelle de P interruption du gene orfi. 

10 

EXEMPLE 24 : Amelioration de la production en spiramycines par 
surexpression du gene orf28c 

24 A Construction du plasmide pSPM75 : 

Le gene orf28c a etc amplifie par PCR en utilisant un couple 
15 d'oligonucleotides comportant un site de restriction Hindlll ou un site de restriction 
BamHI. Ces amorces ont la sequence suivante : 

KF30 : 5> AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ID N° 138) 
avec un site de restriction HindUl (qui figure en gras) 

KF31 : 5' GGATCCCGCGACGGACACGACCGCCGCGCA 3' (SEQ ID N° 139) 

20 avec le site de restriction BamHI (qui figure en gras) 

Les amorces KF30 et KF31 portent respectivement le site de restriction Hindm et 
BamHI (sequence en gras). Le couple d'amorces KF30 et KF31 permet d'amplifier un 
fragment d'ADN d'une taille d'environ 1,5 kb contenant le gene orf28c en utilisant 
comme matrice le cosmide pSPM36 (cf. ci-dessus). Le fragment de 1,5 kb ainsi obtenu 

25 a ete clone dans le vecteur pGEM-T easy (commercialise par la societe Promega 
(Madison, Wisconcim USA)) pour dormer naissance au plasmide pSPM74. Le plasmide 
pSPM74 a ensuite ete digere par les enzymes de restriction HindUl et BamHI et Finsert 
HindW BamHI d'environ 1,5 kb obtenu a ete sous clone dans le vecteur pUWL201 (cf 
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exemple 17.1) prealablement digere par les memes enzymes. Le plasmide ainsi obtenu a 
ete nomme pSPM75, il contient l'ensemble de la sequence codante de orf28c placee 
sous le contr61e du promoteur ermE*. 

24.2 Transformation de la souche OSC2 par le plasmide pSPM75 : 

Le plasmide pSPM75 a ete introduit dans les souches OSC2 par 
transformation de protoplastes (Kieser, T et al, 2000). Apres transformation des 
protoplastes, les clones sont selectionnes pour leur resistance au thiostrepton. Les 
clones sont ensuite repiques sur un milieu contenant du thiostrepton et la 
transformation par le plasmide est verifiee par extraction de plasmides. Deux clones 
ont plus particulierement ete selectionnes et nOmmes OSC2/pSPM75(l) " et 
OSC2/pSPM75(2). 

Afin de tester l'effet de la surexpression du gene orf28c sur la production de 
spiramycines, la production en spiramycines des clones OSC2/pSPM75(l) et 
OSC2/pSPM75(2) a ete testee par la technique decrite dans l'exemple 15. L' analyse 
de la production en spiramycines de la souche OSC2 a egalement ete effectee en 
parallele pour comparaison. II a ainsi pu etre observe que la presence du plasmide 
pSPM75 augmente significativement la production en spiramycines de la souche 
OSC2. Ceci demontre que la surexpression de orf28c conduit a une augmentation de 
la production en spiramycines et confirme son role en tant que regulateur. 

La production en spiramycines des clones OSC2/pSPM75(l) et 
OSC2/pSPM75(2) a egalement ete analys6e par CLHP (de la meme maniere que 
dans l'exemple 17.2). L'analyse de la production en spiramycines de la souche OSC2 
a egalement ete effectee en parallele pour comparaison. Les resultats de cette analyse 
sont presentes dans le tableau 44, les donnees sont exprimees en mg par litre de 
sumageant. Les resultats correspondent a la production totale en spiramycines 
(obtenue en additionnant la production en spiramycine I, II et III). 
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Tableau 44. Production en spiramycines des souches derivees de OSC2 
1ransformeparpSPM75, (resultats exprimes en mg/I). 



Souche 


Spiramycines 


OSC2 


50 


OSC2/pSPM75(l) 


120 


OSC2/pSPM75(2) 


155 



Ainsi, il est observe que la presence du plasmide pSPM75 augmente 
significativement la production en spiramycines de la souche OSC2. Ceci demontre 
bien que la surexpression de orf28c a un effet positif sur la production en 
spiramycines. 
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Liste des constructions decrites dans la presente demande 

Liste des abreviations : Am : Ampicilline ; Hyg: Hygromycine ; Sp : Spiramycine ; Ts 
Thiostrepton ; Cm : Chloramphenicol. Kn : Kanamycine, Apra : apramycine. 



Nom de la 
construction 


Marqueur 
de selection 


Principales caracteristiques 


Reference 


pWE15 


Am 




(Wahl, etaL, 1987) 


pWEDl 


Am 


pWE15 dans lequel un 
fragment Hpal-Hpal de 4.1 kb 
a ete delete 


(Gourmelen et aL, 
1998) 


pOJ260 


Apra 


Conjugatif, non replicatif chez 
Streptomyces 


(Bierman et aL, 
1992) 


pHP45 Qhyg 


Hyg 


Cassette Qhyg dans pHP45. 


(Blondelet-Rouault 
etaL, 1997) 


pKC505 


Apra 


Cosmide 


(Richardson MA et 
al, 1987) 


pIJ486 


Ts 


Plasmide replicatif 
multicopies Streptomyces 


(Ward aL, 1986) 


pOSint3 


Am 


ptrc-xis-int dans pTrc99A 


(Raynal 1998) 


pWHM3 


Am, Ts 


Vecteur navette replicatif E. 
coli/Streptomyces . 


(Varaet aL y 1989) 


pKOBEG 


Cm 




(Chaveroche et aL, 
2000) 


pGP704Not 


Am 




(Chaveroche et aL, 
2000) 


pMBL18 


Am 




(Nakano et aL, 
1995) 


pGEM-T Easy 


Am 


vecteur E. coli pour clonage 
de produits PCR 


Mezei et aL, 1 994 . 
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pOS49.1 


Am 


pWEDl avec insert au niveau 


Exempie 2 






du site BamHI 




pOS49.11 


Am 


Fragment Sad de pOS49.1 
dans pUC19. 


Exemple 2 


pOSC49.12 


Ch 


Fragment Xhol de pOS49.11 
dans pBC SK+ 


Exempie 2 


pOS49.14 


Cm , Hyg 


pOSC49.12 avec le gene or/3 
interrompu par la cassette 
Qhyg 


Exemple 2 


pOS49.16 


Apra, Hyg 


Insert de pOS49.14 dans 
pOJ260 


Exempie 2 




Cm 


Fragment BamHVPstl de 
3,7kb de pOS49.1 dans pBC 
SK+ 


Exemple 3 


pOS44.1 


Apra, Sp 


pKC505 contenant un insert 
conferant la resistance la 
spiramycine chez A 
griseo/uscus 


(Pemodet et al. 9 
1999) 


pOS44.2 


Ts, Sp 


Fragment Sau3Al de 1,8 kb 
pOS44.1 danspIJ486 


Exemple 3 


pOS44A 


Am 


Insert de pOS44.2 dans 
pUC19 


Exemple 3 


pSPM5 


Am 


pWEDl avec insert d'ADN de 
S. ambo/aciens an niveau du 
site BamHI 


Exemple 3 


pSPM7 


Am 


pWEDl avec insert d'ADN de 
S. ambo/aciens an niveau du 
site BamHI 


Exemple 3 
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pOSK1205 


Hyg 


^pF r^AyfV Hanc: lecmel hvc 

pj3JV-v^lVlV Holla it/V^u.V'i ri y & 

remplace neo 


Exemple 5 


pOS49.67 


Apra 


Fragment EcoRl-SacI de 

deletion interne de 504 
nucleotides, dans pOJ260 


Exemple 6 


pOS49.88 


Am 


Fragment oe :>./ ku 
EcoRl de pOS49.1 dans 
pUC19 


Fxemnle 7 


pOS49.106 


Am 


a C\ OO /-»xT-£i/-* Ltiirr /lane nvfiR 

pU4y.oo avec riyg ucuis orjo 
(hyg et orf8 dans la meme 
orientation; 


Fx enrol e 7 


pOS49.120 


Am 


pOS49.88 avec hyg dans o?;/^ 

V 3 <^ ™*J® VJO-llo vj.W'O 

orientations opposees) 


Exemple 7 . : 

■$ - 


pOS49.107 


Apra, Hyg 


Insert de pOS49.106 dans 
p(JJ2oU 


Exemple 7 


pOS49.32 


Am, Kn 


Fragment de 1,5 kb interne a 
orflO dans pCR2.1-TOPO 


Exemple 8 


pOS49.43 


Am, Kn 


pOS4y.3z avec /zyg aans orjiv 
(hyg et or/70 dans la meme 
orientation) 


Fxerrmle 8 


pOS49.44 


Am, Kn 


pOS49.32 avec /ryg dans or/7C 
(7*v# et orflO dans des 
orientations opposees) 


Exemple 8 


pOS49.50 


Apra, Hyg 


Insert de pOS49.43 dan* 
pOJ260 


5 Exemple 8 


pWHM3Hyg 


Am, Hyg 


pWHM3 dans lequel tsr es 
remplace par hyg 


t Exemple 10 
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POSV508 


Am, Ts 


Vitrc-xis-int dans pWHM3 


Exemple 9 


pattlHhyg+ 

- - - - - 


Cm, Hyg 


Cassette attlOhyg-f dans pBC 
SK+ dont le site HindlJl a ete 
supprime 


Ex envoi e 9 


patOQaac- 


Cm,Gn 


Cassette att3f2aac- dans pBC 
SK+ dont le site HindJR a ete 
supprime 


Exemple 9 


pOSV510 


Am, Hyg 


pro pra-Amh dans 
pWHM3Hyg 


Exemple 10 


pOS49.99 


Am 


Fragment EcoRl-BamHl de 
4,5 kb de pSPM5 dans pUC19 


Exemple 10 


pOSK1102 


Am, Apra 


pGP704Not contenant la 
cassette att3Qaac- 


Exemple 1 0 


pSPM17 


Am, Apra 


pOS49,99 dans lequel or/2 est 
inteTTommiP nar la oa^pftp 
attSQaac- 


Exemple 10 


pSPM21 


Hve Anra 


pV/urvlZ,VJ VVJ IllCIItti.il I lIloCI I 

EcoRI-Xbal de pSPM17 (dans 
leouel orf2 est interromnne 
par la cassette attSQaac-) 


jcxcmpie i u 


pSPM502 


Am 


Fragment BgM de 15,1 kb de 
pSPM7 dans pMBLl 8 


Exemple 1 1 


pSPM504 


Hyg 


Insert de pSPM502 dans 
pOSK1205 


Exemple 1 1 


pSPM507 


Hyg, Apra 


pSPM504 dans lequel or/72 
est interrompue par la cassette 
att3Qaac- 


Exemple 1 1 


pSPM508 


Hyg, Apra 


pSPM504 dans lequel orfl3c 
est interrompue par la cassette 
attSQaac- 


Exemple 12 
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P SPM509 


Hyg, Apra 


pSPM504 dans lequel orfl4 
est interrompue par la cassette 
attSQaac- 


Exemple 13 


pBXLllll 


Am 


Fragment de 1,11 kb 
contenant orf6* amplifie par 
PGR a partir de pSPM7, dans 
le vecteur pGEM-T Easy 


Exemple 14 


pBXL1112 


Am, Hyg 


pBXLllll dans lequel la 
cassette attlQhyg+ a ete 
introduite apres deletion de 
120 pb dans la sequence 
codante du gene orf6* 


Exemple 14 


pBXL1113 


Apra, Hyg 


Insert Pstl de 3.7 kb de 
pBXLl 1 12 dans pOJ260 


Exemple 14 

. r > 


pSPM520 


Am 


Fragment de PCR amplifie par 
les oligonucleotides EDR39- 
EDR42 dans pGEM-T Easy 


Exemple 1 7 


pSPM521 


Am 


Fragment de PCR amplifie par 
les oligonucleotides EDR40- 
EDR42 dans pGEM-T Easy 


Exemple 1 7 


pSPM522 


Am 


Fragment de PCR amplifie par 
les oligonucleotides EDR41- 
EDR42 dans pGEM-T Easy 


Exemple 17 


pUWL201 


Am , Ts 




(Doumith et aL> 
2000) 


pSPM523 


Am, Ts 


Fragment Hindlll-BamHl at 
V insert du plasmide pSPM52( 
dans le vecteur pUWL201 


? Exemple 17 

) 


pSPM524 


Am, Ts 


Fragment HincHR-BamHI d 
l'insert du plasmide pSPM52 


s Exemple 17 
1 
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dans le vecteur pUWL201 




pSPM525 


Am, Ts 


Fragment HindUI-BamHl de 
T'insert du plasmide pSPM522 
dans le vecteur pUWL201 


Exemple 17 


pSPM527 


Am 


pSPM521 avec decalage du 
cadre de lecture au niveau du 
site Xhol 


Exemple 1 7 


pSPM528 


Am , Ts 


Fragment HindlR-BamBI de 
Pinsert du plasmide pSPM527 
dans le vecteur pUWL201 


Exemple 1 7 


pVF 10.4 






(Vara et aL, 1985; 
Lacalle^a/., 1989) 


pPM803 


Ts 




(MazodierJP. et aL, 
1989) 


pGEM-T-pac- 
oriT 


Am 


Cassette pac-oriT (amplifiee 
par PCR a partir de pVF 10.4 
et pPM803) dans dans pGEM- 
TEasy 


Exemple 1 8 


pWED2 


Am 


Cassette pac-oriT obtenue a 
partir de pGEM-T -pac-oriT 
inseree dans pWEDl 


Exemple 18 


pSPM34 


Am 


pWED2 avec insert au niveau 
du site BamEl 


Exemple 19 


pSPM35 


Am 


pWED2 avec insert au niveau 
du site BamHl 


Exemple 19 


pSPM36 


Am 


pWED2 avec insert au niveau 
du site BaniHl 


Exemple 19 


pSPM37 


Am 


pWED2 avec insert au niveau 
du site BamHI 


Exemple 19 
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pSPM38 


Am 


pWED2 avec insert au niveau 
du site BamHl 


Exemple 19 


pSPM39 


Am 


pWED2 avec insert au niveau 
du site BamHl 


Exemple 19 


pSPM40 


Am 


pWED2 avec insert au niveau 
du site BamHl 


Exemple 19 


pSPM41 


Am 


pWED2 avec insert au niveau 
du site BamHl 


Exemple 19 


pSPM42 


Am 


pWED2 avec insert au niveau 
du site BamHl 


Exemple 19 


pSPM43 


Am 


pWED2 avec insert au niveau 
du site BamHl 


Exemple 1 9 


pSPM44 


Am 


pWED2 avec insert au niveau 
du site BamHl 


Exemple 19 


pSPM45 


Am 


pWED2 avec insert' au niveau 
du site BamHl 


Exemple 19 


pSPM47 


Am 


pWED2 avec insert au niveau 
du site BamHl 


Exemple 19 


pSPM48 


Am 


pWED2 avec insert au niveau 
du site BamHl 


Exemple 19 


pSPMSO 


Am 


pWED2 avec insert au niveau 
du site BamHl 


Exemple 19 


pSPMSl 


Am 


pWED2 avec insert au niveau 
du site BamHl 


i Exemple 19 


pSPM52 


Am 


pWED2 avec insert au niveau 
du site BamHl 


i Exemple iy 


pSPM53 


Am 


pWED2 avec insert au niveai 
du site BamHl 


i Exemple 19 


pSPM55 


Am 


pWED2 avec insert au niveai 


x Exemple 19 
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dusiteitemHI 




pSPM56 


Am 


pWED2 avec insert au niveai 
du site BamHI 


i Exemple 1 9 


pSPM58 


Kn - 


Fragment Pstl-Pstl d'enviror 
6kb de Pinsert de pSPM36 
dans pBK-CMV 


i Exemple 19 


pSPM72 


Kn 


Fragment Stul-Stul d' environ 
10 kb de Pinsert de pSPM36 
clone dans pBK-CMV 


Exemple 1 9 


pSPM73 


Cm 


Fragment EcoRl-Hindm de 
1 'insert de pSPM72 dans pBC- 
SK+ 


Exemple 19 


pSPM515 


Am 


Fragment de PCR amplifie par 
EDPv3 1 -EDR37 dans pGEM-T 
easy 


Exemple 22 


pSPM519 


Am, Ts 


Insert HindUUXbal de 
pSPM515 dans pUWL201 


Exemple 22 


pOS49.52 


Apra 


Sequence codante de tylB sous 
controle du promoteur ermE* 
dans le plasmide pKCl 21 8 


Exemple 23 


pSPM74 


Am 


Fragment de PCR amplifie par 
KF30-KF31 dans pGEM-T 
easy 


Exemple 24 


pSPM75 


Am, Ts 


Insert HindlU/BamBl de 
pSPM74 dans pUWL201 


Exemple 24 
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Depot de materiel biologigne 

Les organismes suivants ont ete deposes le 10 juillet 2002 aupres de la Collection 
Nationale de Cultures de Microorganismes (CNCM), 25 rue du Docteur Roux, 75724 
Paris Cedex 15, France, selon les dispositions du Traite de Budapest. 

5 - Souche OSC2 sous le numero d'enregistrement 1-2908. 

- Souche SPM501 sous le numero d'enregistrement 1-2909. 

- Souche SPM502 sous le numero d'enregistrement 1-291 0. 

- Souche SPM507 sous le numero d' enregistrement 1-29 1 1 . 

- Souche SPM508 sous le numero d'enregistrement 1-2912. 

A 

10 - Souche SPM509 sous le numero d'enregistrement 1-2913. 

- Souche SPM21 sous le numero d'enregistrement 1-2914. 

- Souche SPM22 sous le numero d' enregistrement 1-29 1 5 . 

- Souche OS49.67 sous le numero d'enregistrement 1-2916. 

- Souche OS49.107 sous le numero d'enregistrement 1-2917. 

15 - Souche Escherichia Coli DH5a contenant le plasmide pOS44.4 sous le numero 
d'enregistrement 1-2918. 

Les organismes suivants ont ete deposes le 26 fevrier 2003 aupres de la 
Collection Nationale de Cultures de Microorganismes (CNCM), 25 rue du Docteur 
Roux, 75724 Paris Cedex 15, France, selon les dispositions du Traite de Budapest. 

20 - Souche SPM502 pSPM525 sous le numero d'enregistrement 1-2977. 
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REVENDICATIONS 

1. Polynucleotid e codant un polypeptide implique d ans la biosynthese des 

spiramycines caracterise en ce que la sequence dudit polynucleotide est : 
5 (a) l'une des sequences SEQ ID N° 3, 5, 7, 9, 1 1, 13, 15, 17, 19, 21, 23, 25, 28, 

30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 
107, 109, 111, 113, 115, 118, et 120, 

(b) l'une des sequences constitutes par les variants des sequences (a), 

(c) Tune des sequences derivees des sequences (a) et (b) en raison de la 
10 degenerescence du code genetique. 

.< r 

2. Polynucleotide s'hybridant dans des conditions d'hybridation de forte 
stringence a au moins Tun des polynucleotides selon la revendication 1 . 

15 3. Polynucleotide presentant au moins 70%, 80%, 85%, 90%, 95% ou 98% 

d'identite en nucleotides avec un polynucleotide comprenant au moins 10, 12, 15, 18, 
20 a 25, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 
600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, ■ 
1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850 ou 1900 

20 nucleotides consecutifs d'un polynucleotide selon la revendication 1. 

4. Polynucleotide selon la revendication 2 ou 3 caracterise en ce qu'il est isole 
a partir d'une bacterie du genre Streptomyces. 

25 5. Polynucleotide selon la revendication 2, 3 ou 4 caracterise en ce qu'il code 

une proteine impliquee dans la biosynthese d'un macrolide. 

6. Polynucleotide selon la revendication 2, 3, 4 ou 5 caracterise en ce qu'il 
code une proteine ayant une activite similaire a la proteine codee par le polynucleotide 
30 avec lequel il s'hybride ou il presente l'identite. 
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7. Polypeptide resultant de l'expression d'un polynucleotide selon la 
revendi cation 1, 2, 3, 4, 5 ou 6. 

8. Polypeptide implique dans la biosynthese des spiramycines caracterisee en 
ce que la sequence dudit polypeptide est : 

(a) l'une des sequences SEQ ID N° 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 
27, 29, 31, 32, 33, 35, 37, 38, 39, 41, 42, 44, 46, 48, 50, 51, 52, 54, 55, 56, 57, 58, 59, 
61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 108, 110, 112, 114, 116, 117, 119 et 
121, 

(b) l'une des sequences telles que defmies en (a) excepte que tout au long de 
ladite sequence un ou plusieurs acides amines ont ete substitues, inseres ou deletes 
sans en affecter les proprietes fonctionnelles, 

(c) l'une des sequences constitutes par les variants des sequences (a) et (b). 

9. Polypeptide presentant au moins 70%, 80%, 85%, 90%, 95% ou .98% 
d'identite en acides amines avec un polypeptide comprenant au moins 10, 15, 20,„30 a 
40, 50, 60, 70, 80, 90,100, 120, 140, 160, 180, 200, 220, 240, 260, 280, 300, 320,340, 
360, 380, 400, 420, 440, 460, 480, 500, 520, 540, 560, 580, 600, 620 ou 640 acides 
amines consecutifs d'un polypeptide selon la revendication 8. 

10. Polypeptide selon la revendication 9 caracterise en ce qu'il est isole a partir 
d'une bacterie du genre Streptomyces. 

11. Polypeptide selon la revendication 9 ou 10 caracterise en ce qu'il code une 
proteine impliquee dans la biosynthese d'un macrolide. 

12. Polypeptide selon la revendication 9, 10 ou 11 caracterise en ce qu'il a une 
activite similaire a celle du polypeptide avec lequel il partage l'identite. 
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13. ADN recombinant caracterise en ce qu'il comprend au moins un 
polynucleotide selon rune des revindications i, 2, 3, 4, 5 ou 6. 

14. ADN recombinant selon la revendication 13 caracterise en ce que le dit 
ADN recombinant est compris dans un vecteur. 

15. ADN recombinant selon la revendication 14 caracterise en ce que ledit 
vecteur est choisi parmi les bacteriophages, les plasmides, les phagemides, les 
vecteurs integratifs, les fosmides, les cosmides, les vecteurs navettes, les BAC ou les 
PAC. 



16. ADN recombinant selon la revendication 15 caracterise en ce qu'il est 
choisi parmi pOS49.1, pOS49.11, pOSC49.12, pOS49.14, pOS49.16, pOS49.28, 
pOS44.1, pOS44.2, pOS44.4, pSPM5 5 pSPM7, pOS49.67, pOS49.88, pOS49.106, 
pOS49.120, pOS49.107, pOS49.32, pOS49.43, pOS49.44, pOS49.50, pOS49.99, 
pSPM17, pSPM21, pSPM502, pSPM504, p'SPM507, pSPM508, pSPM509, pSPMl, 
pBXLllll, pBXL1112, pBXL1113, pSPM520, pSPM521, pSPM522, pSPM523, 
pSPM524, pSPM525, pSPM527, pSPM528, pSPM34, pSPM35, pSPM36, pSPM37, 
pSPM38, pSPM39, pSPM40, pSPM41, pSPM42, pSPM43, pSPM44, pSPM45, 
pSPM47, pSPM48, pSPM50, pSPMSl, pSPM52, pSPM53, pSPM55, pSPM56, 
pSPM58, pSPM72, pSPM73, pSPM515, pSPM519, pSPM74 et pSPM75. 

17. Vecteur d'expression caracterise en ce qu'il comprend au moins urie 
sequence d'acide nucleique codant un polypeptide selon la revendication 7, 8 5 9, 10, 
11 ou 12. 

18. Systeme d'expression comprenant un vecteur d* expression approprie et 
une cellule hote permettant Pexpression d'un ou plusieurs polypeptides selon la 
revendication 7, 8, 9, 10, 1 1 ou 12. 
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10 



19. Systeme d'expression selon la revendication 18 caracterise en ce qu'il est 
choisi parmi les systemes d'expression procaryotes ou les systemes d'expression 
eucaryotes. 

20. Systeme d'expression selon la revendication 19 caracterise en ce qu'il est 
choisi parmi les systemes d'expression chez la bacterie E. coli, les sytemes 
d'expression baculovirus permettant une expression dans des cellules d'insectes, les 
sytemes d'expression permettant une expression dans des cellules de levures, les 
sytemes d'expression permettant une expression dans des cellules de mammiferes. 

21. Cellule hqte dans laquelle a ete introduit au moins un polynucleotide et/ou 
au moins un ADN recombinant et/ou au moins un vecteur d'expression selon Tune des 
revendications 1, 2 3 3, 4, 5, 6, 13, 14, 15, 16 ou 17. V- 

■ 

15 22. Procede de production d'un polypeptide selon la revendication 7, 8, 9, 10, 

1 1 ou 12 caracterise en ce-que ledit procede comprend les etapes suivantes: } v 

a) inserer au moins un acide nucleique codant ledit polypeptide dans un 
vecteur approprie ; 

b) cultiver, daris un milieu de culture approprie, une cellule hote prealablement 
20 . transformer ou transfectee avec le vecteur de l'etape a) ; 

c) recuperer le milieu de culture conditionne ou un extrait cellulaire; 

d) separer et pvirifier a partir dudit milieu de culture ou encore a partir de 
l'extrait cellulaire obtenu a l'etape c), ledit polypeptide ; 

e) le cas echeant, caracteriser le polypeptide recombinant produit. 



25 



23. Microorganisme bloque dans une etape de la voie de biosynthese d'au 
moins un macrolide. 



1er depot 



195 

24. Microorganisme selon la revendication 23 caracterise en ce qu'il est obtenu 
en inactivant la fonction d'au moins une proteine impliquee dans la biosynthese de ce 
ou de ces macrolides dans un microorganisme producteur de ce ou de ces macrolide. 

5 25. Microorganisme selon la revendication 24 caracterise en ce que 

Pinactivation de cette ou de ces proteines est effectuee par mutagenese dans le ou les 
genes codant ladite ou lesdites proteines ou par expression d'un ou de plusieurs ARN 
anti-sens complementaires de TARN ou des ARN messagers codant ladite ou lesdites 
proteines. 

10 

26. Microorganisme selon la revendication 25 caracterise en ce que 
Pinactivation de cette ou de ces proteines est effectuee par mutagenese par irradiation, 
par action d' agent chimique mutagene, par mutagenese dirigee ou par remplacement 
de gene. 

15 

27. Microorganisme selon la revendication 25 ou 26 caracterise en ce que la ou 
les mutageneses sont effectuees in vitro ou in situ^ par suppression, substitution, 
deletion et/ou addition d'une ou plusieurs bases dans le ou les genes consideres ou par 
inactivation genique. 

20 

28. Microorganisme selon la revendication 23, 24, 25, 26 ou 27 caracterise en 
ce que ledit microorganisme est une bacterie du genre Streptomyces. 

29. Microorganisme selon la revendication 23, 24, 25, 26, 27 ou 28 caracterise 
25 en ce que le macrolide est la spiramycine. 

30. Microorganisme selon la revendication 23, 24, 25, 26, 27, 28 ou 29 
caracterise en ce que ledit microorganisme est une souche de S. ambofaciens. 
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31. Microorganisme selon la revendication 23, 24, 25, 26, 27, 28, 29 cm 30 
caracterise en ce que la mutagenese est effectuee dans au moins un gene comprenant 
une sequence selon Tune des revendication 1, 2, 3, 4, 5 ou 6. 

5 32. Microorganisme selon la revendication 25, 26, 27, 28, 29, 30 ou 31 

caracterise en ce que la mutagenese est effectuee dans un ou plusieurs genes 
comprenant une des sequences correspondant a une ou plusieurs des sequences SEQ 
ID N° 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25/28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 
60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 118, et 120, 

10 

33. Microorganisme selon la revendication 25, 26, 27, 28, 29, 30, 31 ou 32 
caracterise en ce que la mutagenese consiste en l'inactivation genique d'un.gene 
comprenant une sequence correspondant a la sequence SEQ ID N° 13. y 

15 34. Souche de Streptomyces ambofaciens caracterisee en ce qu'il s'agit d'une 

« 

souche choisie parmi : 
- Tune des souches deposees aupres de la Collection Nationale de Cultures de 
Microorganismes (CNCM) le 1 0 juillet 2002 sous le numero d'enregistrement I- 
2909, 1-2911, 1-2912, 1-2913, 1-2914, 1-2915, 1-2916 ou 1-2917 
20 - la souche SPM5 10. 

35. Procede de preparation d f un intermediaire de biosynthese de macrolide 
caracterise en ce qu'il comprend les etapes suivantes : 

a) cultiver, dans un milieu de culture approprie, un microorganisme selon Tune 
25 des revendications 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33 ou 34, 

b) recuperer le milieu de culture conditionne ou un extrait cellulaire, 

c) separer et purifier a partir dudit milieu de culture ou encore a partir de 
Textrait cellulaire obtenu a l'etape b), ledit intermediaire de biosynthese. 
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36. Procede de preparation d'une molecule derivee d'un macrolide caracterise 
en ce que Ton prepare un intermediaire de biosynthese selon le procede de la 
revindication 35 et que Ton modifie P intermediaire ainsi produit 

5 37. Procede de preparation selon la revendication 36 caracterise en ce que Ton 

modifie ledit intermediaire par voie chimique, biochimique, enzymatique et/ou 
microbiologique. 

38. Procede de preparation selon la revendication 36 ou 37 caracterise en ce 
10 que Ton introduit dans ledit microorganisme un ou plusieurs genes codant des 

proteines susceptibles de modifier Tintermediaire en s'en servant comme sub'strat. 

39. Procede de preparation selon la revendication 36, 37 ou 38 caracterise en 
ce que le macrolide est la spiramycine. 

15 

40. Procede de preparation selon la revendication 36, 37, 38 ou 39 caracterise 
en ce que le microorganisme utilise est une souche de S. ambofaciens. 

41. Microorganisme produisant de la spiramycine I mais ne produisant pas de 
20 spiramycine II et EI. 

42. Microorganisme selon la revendication 41 caracterise en ce qu'il comprend 
P ensemble des genes necessaires a la biosynthese de la spiramycine I mais que le gene 
comprenant la sequence SEQ ID N° 13 ou Tun de ses variants ou Tune des sequences 

25 derivees de celles-ci en raison de la degenerescence du code genetique et codant un 
polypeptide de sequence SEQ ED N° 14 ou Pun de ses variants n'est pas exprime ou a 
ete rendu inactif. 

43. Microorganisme selon la revendication 42 caracterise en ce que la dite 
30 inactivation est realisee par mutagenese dans le gene codant ladite proteine ou par 
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F expression d'un ARN anti-sens complementaire de TARN messager codant ladite 
proteine. 

44. Microorganisme selon la revendication 43 caracterise en ce que la dite 
5 mutagenese est effectuee dans le promoteur de ce gene, dans la sequence codante ou 

dans une sequence non codante de maniere a rendre inactive la proteine codec ou a en 
empecher son expression ou sa traduction. 

45. Microorganisme selon la revendication 43 ou 44 caracterise en ce que la 
10 mutagenese est effectuee par irradiation, par action d'agent chimique mutagene, par 

mutagenese dirigee ou par remplacement de gene. 

46. Microorganisme selon la revendication 43, 44 ou 45 caracterise en ce que 
la mutagenese est effectuee in viwo ou in situ, par suppression, substitution, deletion^ 

15 et/6u addition d f une ou plusieurs bases dans le gene considere ou par inactivatidri 
genique. , 

47. Microorganisme selon la revendication 41 ou 42 caracterise en ce que ledit 
microorganisme est obtenu en exprimant les genes de la voie de biosynthese de la 

20 spiramycine sans que ceux-ci ne comprennent le gene comprenant la sequence 
correspondant a SEQ ID N° 13 ou 1'un de ses variants ou Tune des sequences derivees 
de celles-ci en raison de la degenerescence du code genetique et codant un polypeptide 
de sequence SEQ ID N° 14 ou Tun de ses variants. 

25 48. Microorganisme selon la revendication 41, 42, 43, 44, 45, 46 ou 47 

caracterise en ce que ledit microorganisme est une bacterie du genre Streptomyces. 

49. Microorganisme selon la revendication 41, 42, 43, 44, 45. 46, 47 ou 48 
caracterise en ce que ledit microorganisme est obtenu a partir d'une souche de depart 
30 produisant les spiramycines I, H et III. 
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50. Microorganisme selon la revendication 41, 42, 43, 44, 45, 46, 47, 48 on 49 

- - earacterise en ce qu-il est obtenu par mutagenese dans un gene .comprenant la - . 

sequence correspondant a SEQ ID N° 13 on Tun de ses , variants pu l'une des 
5 sequences derivees de celles-ci en raison de la degenerescence du code genetique et 

codant un polypeptide de sequence SEQ ID N° 14 ou Tun de ses variants ayant la 

meme fonction. 

51. Microorganisme selon la revendication 41, 42, 43, 44, 45, 46, 47, 48, 49 ou 
10 50 earacterise en ce que ledit microorganisme est obtenu a partir d'une souche de £ 

ambofaciens produisant les spiramycins I, II et III, dans laquelle est effectuee une 
inactivation genique du gene comprenant la sequences correspondant a SEQ ID N° 13 
ou Tune des sequences derivees de celle-ci en raison de la degenerescence du code 
genetique. 

15 

52. Souche de S. ambofaciens caracterisee en ce qu'il s'agit de la souche 
deposee aupres de la Collection Nationale de Cultures de Microorganismes (CNCM) 
le 1 0 juillet 2002 sous le numero d'enregistrement 1-291 0. 

20 53. Precede de production de spiramycine I, earacterise en ce qu'il comprend 

les etapes suivantes : 

(a) cultiver, dans un milieu de culture approprie, un microorganisme selori 
l'une des revendications 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51 ou 52, 

(b) recuperer le milieu de culture conditionne ou un extrait cellulaire, 

25 (c) separer et purifier a partir dudit milieu de culture ou encore a partir de 

Pextrait cellulaire obtenu a Fetape b), la spiramycine I. 

54. Utilisation d'un polynucleotide selon Tune des revendications 1, 2, 3, 4, 5 
ou 6 pour ameliorer la production en macrolides d'un microorganisme. 

30 
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55. Microorganisme mutant producteur de macrohde caracterise en ce qu'il 
possede une modification genetique dans au moins un gene comprenant une sequence 
selon l'une des revendication 1, 2, 3, 4, 5 ou 6 et/ou qu'il surexprime au moins un 
gene comprenant une sequence selon l'une des revendication 1 , 2, 3, 4, 5 ou 6. 

56. Microorganisme mutant selon la revendication 55 caracterise en ce que la 
modification genetique consiste en une suppression, une substitution, une deletion 
et/ou une addition d'une ou plusieuf s bases dans le ou les genes considers dans le but 
d'exprimer une ou des proteines ayant une activite superieure ou d'exprimer un 
niveau plus eleve de cette ou de ces proteines. 

57. Microorganisme mutant selon la revendication 55 caracterise en ce que la 
surexpression du gene considere est obtenue en augmentant le nombre de copie de ce 
gene et/ou en placant xm promoteur plus actif que le promoteur sauvage. 

58. Microorganisme mutant selon la revendication 55 ou 57 caracterise en ce 
que la surexpression du gene considere est obtenue en transformant un 
microorganisme producteur de macrolide par une construction d'ADN recombinant 
selon la revendication 13, 14 ou 17, permettant la surexpression de ce gene. 

59. Microorganisme mutant selon la revendication 55, 56, 57 ou 58 caracterise 
en ce que la modification genetique est effectuee dans un ou plusieurs genes 
comprenant une des sequences correspondant a une ou plusieurs des sequences SEQ 
ID N° 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 
60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 118, et 120, 
ou l'un de ses variants ou l'une des sequences derivees de celles-ci en raison de la 
degenerescence du code genetique. 

60. Microorganisme mutant selon la revendication 55, 56, 57, 58 ou 59 
caracterise le microorganisme surexprime un ou plusieurs genes comprenant une des 
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sequences correspondant a une on plusieurs des sequences SEQ ID N° 3, 5, 7, 9, 11, 
13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 

72, 74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 118, et 120, ou Tun de ses variants 

ouTune des sequences derivees de celles-ci en raison de la degenerescence du code 
5 genetique. 

61. Microorganisme mutant selon la revendication 55, 56, 57, 58, 59 ou 60 
caracterise en ce que ledit microorganisme est une bacteries du genre Streptomyces. 

10 62. Microorganisme mutant selon la revendication 55, 56, 57, 58, 59, 60 ou 61 

caracterise en ce que le macrolide est la spiramycine. 

63. Microorganisme mutant selon la revendication 55, 56, 57, 58, 59, 60, 61 ou 
62 caracterise en ce que ledit microorganisme est une souches de S. ambofaciens. 

15 

64. Procede de production de macrolides, caracterise en ce qu'il comprend les 
etapes suivantes : 

(a) cultiver, dans un milieu de culture approprie, un microorganisme selon 
Tune des revendications 55, 56, 57, 58, 59, 60, 61, 62, 63 ou 64, 
20 (b) recuperer le milieu de culture conditionne ou un extrait cellulaire, 

(c) separer et purifier a partir dudit milieu de culture ou encore a partir de 
P extrait cellulaire obtenu a Petape b), le ou lesdits macrolides produits. 

65. Utilisation d T une sequence et/ou d'un ADN recombinant et/ou d ! un vecteur 
25 selon Pune des revendication 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16 ou 17 

pour la preparation d'antibiotiques hybrides. 

66. Utilisation d'au moins un polynucleotide et/ou au moins un ADN 
recombinant et/ou au moins un vecteur d'expression et/ou au moins un polypeptide 
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et/ou au moms une cellule hote selon l'une des revendications 1, 2, 3, 4, 5, 6, 7, 8, 9, 
10, 11, 12 13, 14, 15, 16, 17 ou 21 pour realiser une ou plusieurs bioconversions. 

67. Polynucleotide caracterise en ce qu'il s'agit d'un polynucleotide 
complementaire de l'un des polynucleotides selon la revendication 1, 2, 3, 4, 5, ou 6. 

68. Microorganisme producteur d'au moins une spiramycine caracterise en 

ce qu'il surexprime : 

-un gene susceptible d'etre obtenu par amplification en chaine par 
polymerase (PCR) en utilisant le couple d'amorces de sequence suivante : 5' 
AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ID N° 138) et 5' 
GGATCCCGCGACGGACACGACCGCCGCGCA 3' (SEQ ID N° 139) et comme 
matrice le cosmide pSPM36 ou l'ADN total de Streptomyces ambofaciens, 

-ou un gene derive de celui-ci en raison de la degenerescence du code 
genetique. 

69. Microorganisme selon la revendication 68 caracterise en ce qu'il s'agit 
d'une bacterie du genre Streptomyces. 

70. Microorganisme selon la revendication 68 ou 69 caracterise en ce qu'il 
s'agit d'une bacterie de l'espece Streptomyces ambofaciem. 

71. Microorganisme selon la revendication 68, 69 ou 70 caracterise en ce 
que la surexpression dudit gene est obtenue par transformation dudit 
microorganisme par un vecteur d'expression. 

72. Souche de Streptomyces ambofaciens caracterisee en ce qu'il s'agit de la 
souche OSC2/pSPM75(l) ou de la souche OSC2/pSPM75(2). 

73. ADN recombinant caracterise en ce qu'il comprend : 

- un polynucleotide susceptible d'etre obtenu par amplification en chaine par 
polymerase en utilisant le couple d'amorces de sequence suivante: 5' 
AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ID N° 138) et 5' 
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GGATCCCGCGACGGACACGACCGCCGCGCA V (SEQ ID N° 139) et 
corame matrice le cosmide pSPM36 ou l'ADN total de Streptomyces 
dmbofdciens^ 

- ou, un fragment d'au moins 10,' 12, 15, 18, 20 a 25, 30, 40, 50, 60, 70, 80, 90, 
5 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 

850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 
1460, 1470, 1480, 1490 ou 1500 nucleotides cons6cutifs de ce polynucleotide. 

74. ADN recombinant selon la revendication 73 caracterise en ce qu'il s'agit 
d'un vecteur. 

10 75. ADN recombinant selon la revendication 73 on 74 caracterise en ce 

qu'il s'agit d'un vecteur d'expression. 

76. Cellule bote dans laquelle a ete introduit au moins un ADN recombinant 
selon Tune des revendications 73, 74 ou 75. 

77. Procede de production d'un polypeptide caracterise en ce que ledit 
15 procede comprend les etapes suivantes: 

a) transformer une cellule bote par au moins un vecteur d'expression selon la 

revendication 75; 

b) cultiver, dans un milieu de culture approprie, ladite cellule hote; 

c) recuperer le milieu de culture conditionne ou un extrait cellulaire; 

20 d) separer et purifier a partir dudit milieu de culture ou encore a partir de 

Pextrait cellulaire obtenu a I'etape c), ledit polypeptide ; 

e) le cas echeant, caracteriser le polypeptide recombinant produit. 

78. Microorganisme selon la revendication 51 caracterise en ce que 
l'inactivation genique est effectuee par deletion en phase du gene ou d'une partie 
25 du gene comprenant la sequence correspondant a SEQ ID N° 13 ou Tune des 
sequences derivees de celle-ci en raison de la degenerescence du code genetique. 
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79. Microorganisme selon l'une des revendications 41, 42, 43, 44, 45, 46, 
47, 48, 49, 50, 51 ou 78 caracterise en ce en ce qu'il surexprime en outre : 

- un gene susceptible d'etre obtenu par amplification en chaine par polymerase 
en utilisant le couple d'amorces de sequence suivante : 5' 
AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ID N° 138) et 5' 
GGATCCCGCGACGGACACGACCGCCGCGCA 3' (SEQ ID N° 139) et 
comme matrice le cosmide pSPM36 ou l'ADN total de Streptomyces 
ambofaciens, 

- ou un gene derive de celui-ci en raison de la degenerescence du code 
genetique. 

80. Vecteur depression caracterise en ce que le polynucleotide de 
sequence SEQ ID N° 47 ou un polynucleotide derive de celui-ci en raison de la 
degenerescence du code genetique est place sous le controle d'un promoteur 
permettant l'expression de la proteine codee par le dit polynucleotide chez 
Streptomyces ambofaciens. 

81. Vecteur depression selon la revendication 80 caracterise en ce qu'il 
s'agit du plasmide pSPM524 ou pSPM525. 

82. Souche de Streptomyces ambofaciens transformee par un vecteur selon 
la revendication 80 ou 81. 

83. Microorganisme selon l'une des revendications 41, 42, 43 , 44, 45, 46, 
47, 48, 49, 50, 51, 78 ou 79 caracterise en ce qu'il surexprime en outre le gene de 
sequence codante SEQ ID N° 47 ou d'une sequence codante derivee de celle-ci en 
raison de la degenerescence du code genetique. 

84. Microorganisme selon la revendication 83 caracterise en ce qu'il s'agit 
de la souche SPM502 pSPM525 deposee aupres de la Collection Nationale de 
Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur Roux 
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75724 Paris Cedex 15, France, le 26 fevrier 2003 sous le numero d'enregistrement 
1-2977. 

85. Procede de production de spiramycine(s), caracterise en ce qu'il 
comprend les etapes suivantes : 
5 (a) cultiver, dans un milieu de culture approprie, un microorganisme selon 

1'une des revendications 68, 69, 70, 71, 72, 78, 79, 82, 83 ou 84, 

(b) recuperer le milieu de culture conditionne ou un extrait cellulaire, 

(c) separer et purifier a partir dudit milieu de culture ou encore a partir de 
1' extrait cellulaire obtenu a Fetape b), les spiramycines. 

10 86. Polypeptide caracterise en ce que sa sequence comprend la sequence SEQ 

IDN° 112. 

87. Polypeptide caracterise en ce que sa sequence correspond a la sequence 
traduite de la sequence codante : 

- d'un gene susceptible d'etre obtenu par amplification en chaine par 
15 polymerase (PCR) en utilisant le couple d'amorces de sequence suivante : 5' 
AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ID N° 138) et 5' 
GGATCCCGCGACGGACACGACCGCCGCGCA 3' (SEQ ID N° 139) et comme 
matrice le cosmide pSPM36 ou l'ADN total de Streptomyces ambofaciens, 

-ou d'un gene derive de celui-ci en raison de la degenerescence du code 
20 genetique. 

88. Vecteur d'expression permettant r expression d'un polypeptide selon la 
revendication 86 ou 87 chez Streptomyces ambofaciens. 

89. Vecteur d'expression selon la revendication 88 caracterise en ce qu'il 
s'agit du plasmide pSPM75. 
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FASTA (3.42 Sept 2001) function [optimized, BL50 matrix (15: -5)] 
ktup: 2 join: 37, opt: 25, open/ext: -10/-2, width: 16 

Smith- Waterman score: 1467; 63.130% identity (66.480% ungapped) in 
377 aa overlap (3-367:11-380) 

10 20 30 40 

or f 3 MTIPFLD AGAGYRELRAEIDAAIjQRVSASGRYIiLDAELAAFEEEFAA 

tylB MTGLPRPAVRVPFHDLRDVHAATG VESEIGGALLRVAARGRYL.LGAELAAFEERFAE 

10 20 30 40 50 

50 60 70 80 90 100 
orf 3 YCDNDHCVAVGSGCDAIiELSLRALDIGPGDEVWPAHTFIGTWLAVSATGARPVAV 

tylB YCGNAHC VAVG SGLDDARLAIjWALGVGEGDEVT VP S HTF I ASWL AVSATG AT PVPVE PGD 
60 70 80 90 100 110 



110 120 130 140 150 160 

orf 3 — DPT PDGL SLDP ALVEAALTPRTRALMPVHLHGH PADLDPLL AI AGRHGLAVVED AAQA 



tylB PGEPGPGAFLLDPDRLEAALTPRTRAVMPVHLYGHPVDLDPVGAFAEPHGLAWEDAAQA 
•120 130 • 140 150 160 170 

170 180 190 200 210 220 

orf 3 HG ARY RGRR I G SGH VVAF S F YP GKNLG AMGDGG AVVTGD SG VAERI RL LRNC G SREK YRH 



tylB T-ARYRGRRIGSGHRTAFSFYPGKNLGALGDGGAWTSDPELAIDRLiRLLRNYGAREKYRH 
180 190 200 210 220 230 

230 240 250 260 270 280 

orf 3 E VRSTHSRLDEFQAAVLRAKL.PRLDAWNARRAGTAERYGRALGPVPQI AVP VTAPWADPV 



tylB EERGTNSRLDELQAAVL SVKLP YLDAWNTRRREX AARYGEALiAGL PGVTVP - EGRVAEPV 
240 250 260 270 280 290 

290 300 310 320 330 340 

orf 3 WHLYVIRC AERDELRRRLERAGVQTL IH YPVP PHRS PAY ADD PAG A- PAGTHPLSERLAA 



tylB WHQYVXiR S PYRDRLRRRL AEAG VETLVH YPVAVH AS GAY AG — AGPCPAGGLPRAERLAG 
300 310 320 330 340 350 

350 360 370 380 

orf3 QSLSL PLG PHLGEDEARA WAAVRAAS AGL AAY PT PDGQRF PL VTEKR 



tylB E VLiSL PI GPHLrPDEAVEWIAAVQSAALrDSWEEGP 
360 370 380 
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<110> Aventis Pharma SA 
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<120> POLYPEPTIDES IMPLIQUES DANS LA BIOSYNTHESE DES 

SPIRAMYCINES , SEQUENCES NUCLEOTIDIQUES CODANT CES 
POLYPEPTIDES ET LEURS APPLICATIONS 

<13 0> Biosyn these spiramycines (2) 

<140> 
<141> 



<150> FR0212489 
<151> 2002-10-08 



<160> 139 



<17 0> Patent In Ver. 2.1 



<210> 1 

<211> 30943 • 
<212> ADN 

<213> Streptomyces ambofaciens 



<400> 1 

gaattcggca attcccgggg cgccgggaaa 
gtcggaccgg tcgtcactgc gggaaatcgc 
gttcgccgta ccacgccgtg gcttttctgc 
gcgaactgcc gggcgacagg aacggccggt 
attgtccacc gattctcgtc accggagacg 
gcaccaggtc cgcagggtcg gcgctccgac 
gcacgcggag tcctgggcga gcggagaaga 
ttcgcgacga atatgtcagg tctccccgag 
gcgcccgtcc cgctccgccc cggtcgtcat 
gtgtcaggtt cgccttgccg acattctccg 
ccggaaccac cgtgccgcgc gttcggtcca 
ggtgaggccg tgacgggacc gatggagctg 
gagtggttcg cgtacaacag gacgcgtcat 
tggcaggtct. tcggctacga cgactacgtg 
tcggacttca acatggtgat gccgacgccg 
acgatcggcg cgctggaccc gcccgcgcac 
ttcacccccc gacggatcgc ccggctggag 
ctggacaagg tggggcagca ggacgtcgtc 
ccggtcatcg tgatcgccga actgctgggc 
gagtgggtcg acaccctgct gacgaacgag 
ttcaccgaga cgatcgcgcc cgcgctcaag 
cacgccaagc gggacgcgcc cgccgacgac 
gacggccgcc ggctgaccga cgtcgagatc 
gggcacgtct cctccagcac cctgctcagc 
caggcgctgg aggacctgcg ggccgatcgc 
ctgcgctacc gcagcccctt caacaacatc 
ctcggtccgc tcatggagaa gggccagatg 
gacccccggc acttcccgga cccggacacc 
cacatggcct tcgggcacgg catccaccac 
ggcaaggtca tgctcgaact cctcctggac 
cacaccgtgt tctacgaggc cgaccagctc 
tggaactgaa cccgagggtc tcgtcccgga 
ctcacgaccg cccgataagg agcgccgcca 
ggcgggtcgg caggatcaag ccgtgccggc 



ccggcacgcc attccgacca cggcaacggc 60 
gagttctcca gacacctgca tccctcatat 12 0 
cttttcttga tcttcccgag cgtacagcgg 180 
gaacgacaat caattgtgtc aagttcggag 2 40 
gcgcgggatc atgcgggacc acacggcatc 3 00 
gtcccggccg gtcgcgcact ccggtgacct 360 
tttcagtacc tcgcggcgcg ggacaaccac 42 0 
cggtccgtgc cgccccgccc tgacccgtcc 4 80 
ctcggccgga atttcagtcg gcagctcatt 540 
gagattccta agctctgccg gtaaccggga 600 
cacaccgctt ttcgaggagt ccgactgatg 6 60 
agcaaggacg cggacgcccg ggggctgctt 72 0 
ccggtgttct gggacgagac ccgacaggcg 7 80 
acggtgtcga acaacccgca gttcttctcc 840 
cccgaactgg agatgatcat cggtccgggc 900 
ggaccgatgc gcaagctggt gagccaggcg 960 
cccagggtgc gcgcgatcac cgaggagctc 102 0 
gacgccgtgg gtgacctgtc ctacgcgctg 1080 
atacccgccg gcgaccgtga cctgttccgg 1140 
ggcctggagt acccgaacct cccggacaac 12 00 
gagatgaccg actacctcct gaagcagatc 1260 
ctggtcagcg ggctggtcca ggcggagcag 13 2 0 
gtcaacatcg tcgcgctgct cctgacggcg 13 80 
aacctgttcc tggtcctgga ggagaacccg 1440 
tccctggtgc ccggcgcgat cgaggagacg 1500 
ttccggttcg tcaaggagga caccaccgtc 15 60 
gtgatcgcct ggagccagtc cgccaaccgg 1620 
ttcgacatcc gccgctcgga cggcacccgg 1680 
tgcctgggtg ccgccctcgc ccgcctggag 1740 
cgggtccaag gcttccgcat cgaccacgag 1800 
actccgaagt acctgcccgt ccgggtcgac 1860 
gtccagggcc gtcccgagcc ggccctggac 192 0 
tcgccgagaa cacagccgag ctccctgccc 19 80 
tgatcaggct cgagcagcac atcgacccgc 2040 
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gcggcagcct ctccgtgatc gagtccggcg tgaccgtgga cttccccgtc cgacgcgtct 2100 
actacatgca tggccagacc cagtcctctc ccccgcgcgg cctgcacgcg caccgcaccc 2160 
tggaacaact cgtcatcgcc gtccacggcg ccttctccat caccctcgac gacggcttcc 222 0 
agcacgccac ctaccgtctg gacgaacccg gagccggact ctgcatcggc cccatggtct 228 0 
ggcgcgtcct gaaggacttc gaccccgaca ccgtggccct ggtcctcgcc tcgcagcact 23 40 
acgaggagtc cgactactac cgcgactacg acaccttcct gcatgacgca cggagcctca 2400 
catgaccatc cccttcctcg acgcgggcgc cggctaccgg gagttgcgag ccgagatcga 2 460 
cgcggccctg cagcgggtgt ccgcctccgg ccgctatctg ctcgacgcgg aactcgcggc 2520 
cttcgaggag gagttcgccg cgtactgcga caacgaccac tgtgtggcgg tgggcagtgg 2 5 80 
ctgcgacgcg ctggagctgt ccctgcgggc gctggacatc ggtcccgggg acgaggtggt 2 640 
ggtgcccgcg cacaccttca tcgggacctg gctggccgtg tccgctaccg gggcacggcc 2700 
ggtggccgtc gacccgacgc cggacgggct ctccctcgac ccggcgctgg tggaggcggc 2760 
gctcacccct cggaccagag ccctgatgcc ggtgcacctg cacgggcacc cggccgacct 2820 
cgacccgcta ctggcgatcg ccggacggca cggcctggcc gtggtcgagg acgccgcgca 2 880 
ggcccacggc gcccgttacc ggggccgcag gatcggctcg ggccacgtgg tcgcgttcag 2 940 
cttctacccc ggcaagaacc tcggcgccat gggggacggc ggcgcggtgg tcacgggtga 3 0 00 
ctccggtgtg gccgagcgga tccggttgct gcgcaactgc ggctcgcggg agaagtaccg 3 0 60 
gcacgaggtg cgctcgaccc actcccggct cgacgagttc caggcggccg tgctgcgggc 312 0 
caaactgccg cggctcgacg cgtggaacgc ccgccgggcc ggcacggccg aacggtacgg 3180 
gcgggccctg ggtccggtac cgcagatcgc cgtcccggtc accgctccct gggccgaccc 3240 
ggtgtggcac ctgtacgtga tccgctgcgc ggagcgcgac gagctgcgcc gccggctgga 33 00 
acgagccggg gtccagaccc tgatccacta ccccgtgccc ccgcaccggt ccccggccta 3 3 60 
cgccgacgac ccggccggcg caccggcggg gacccacccg ctcagtgagc gcctggcggc 342 0 
gcagagcctc agccttcccc tgggaccgca cctcggggag gacgaggccc gcgccgtcgt 34 80 
ggcggcggtc cgggcggcgt ccgcagggct ggcggcgtac ccgacgccgg acggccagcg 3540 
ttttcctcta gtgacggaga aacgatgacc gaggtcatgt cagggcgtcc cggaatgaaa 3 600 
gggatcatcc tcgcaggcgg cggagggacc cgcctacgcc ccttgaccgg cacgctgtcc 3660 
aagcaactgc tgcccgtcta cgacaagccg atgatctact acccgctgtc cgtcctgatg 3720 
ctgggcggca tccgcgagat cctcgtcgtc tcctccaccc agcacatcga gctgttccag 3 7 80 
cggctgctgg* gcgacggctc ccgcctcggc ctcgacatca cctacgccga acaggccgag 3 840 
cccgagggca tagcgcaggc catcaccatc ggcaccgacc acatcggcga ctcaccggtc 3900 
gcgctcatcc tgggcgacaa catcttccac ggccccggct tctcggccgt gctccagggc 3960 
agcatccgcc acctcgacgg ctgtgtgctg ttcggctacc cggtcagcga cccgaagcgc 402 0 
tacggcgtcg gcgagatcga cgaccagggc gtactgctgt ccctggagga gaaaccggcc 4080 
cggccccgct ccaacctcgc cgtcaccggc ctctacctct acgacaacga cgtggtcgac 4140 
atcgccaaga acatccggcc ctcggcgcgc ggcgaactcg agatcacgga cgtcaacagg 42 00 
acctacctgg agcagaaacg cgcccggctc atcgaactgg gccacggctt cgcctggctc 42 60 
gacatgggca cccacgactc cctcctccag ggcggccagt acgtccagct catcgagcag 43 2 0 
cgccagggag tgcggatcgc ctgcatcgag gagatcgccc tgcgcatggg cttcatcgac 43 80 
gccgacaccc tccaccggct cggccgcgaa ctgggcacct ccggatacgg cgcgtacctg 4440 
atggaggtgg ccacccgtgc aggcaccgaa tgagacgccg cgccggcccg cccgctccgc 4500 
cggccgacgg ccgccggccc ggatcctcgt caccgggggc gccggcttca tcggctcgcg 4560 
cttcgtgaac gcgctgctgg acggctccct gccggagttc ggcaaacccg aggtgagggt 4620 
gctcgacgcg ctcacctacg cgggcaacct ggccaatctg gccccggtgg gcgactgtcc 4680 
ccggctgcgg atcttcccgg gggacatccg cgaccgcggc gcggtcaccc aggcgatggc 47 4 0 
gggggtcgac ctggtggtgc acttcgcggc cgagtcgcac gtggaccgct cgatcgacga 4800 
cgccgacgcc ttcgtgcgca ccaacgtgct gggcacccag gtcctcctcc aggaggcact 4860 
ggccgtacgc cccgggctgt tcgtgcacgt ctcgacggac gaggtgtacg gctccatcga 4920 
ggaggggtcc tggcccgagg agcacccgct gaaccccaac tcgccctacg ccgcctcgaa 49 80 
ggcgtcctcc gacctgctgg cgctggccca ccaccgcacg cacggactgc cggtgtgcgt 5040 
cacccgctgc tccaacaact acgggcccta ccagtacccg gagaagatca tcccgctgtt 5100 
caccagcagc ctcctcgacg gcgggaccgt cccgctctac ggggacggcg gcaaccggcg 5160 
cgactggctg cacgtggacg accactgccg gggcatcgcc ctggtggccc ggggcggccg 522 0 
gcccggcgag gtctacaaca tcggcggcgg caccgagctg agcaacgtcg agctcacgga 52 80 
gcgtctgctg aaactgtgcg gagccgactg gtcggcggtg cggcgggtgc ccgaccgcaa 5340 
gggccacgac cggcgctact ccgtcgacta caccaagatc gcggacgagc tgggttacgc 54 00 
gccgcggatc accatcgacg aagggctgga gcggaccgtg cactggtacc gggagaaccg 5460 
cgcgtggtgg gcgcccgcga agagggggcg atgacggtga cgaccgcatc cgtggacccg 5520 
ctcgacctgt ggctccgccg gtaccagccg tccgcgtcac ccgccgtccg gctggtgtgc 5580 
ttcccgcacg cgggcggctc ggcgagttcg ttcctgccgt tcacccggca gctgccggac 5640 
cggatcgagg tcgtggccgt ccagtacccc gggcgccagg accgcaggag cgaaccgctg 5700 
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gtcgacacca tcgagggact ggccgagccc ctggccggcc tgctggaggc gcaggccggc 



5760 



CCCCCygugy Lyttyutuyy y^d^o-vj^^u.^ ~=>=> - - ^^^^^ 

gcgctccagc ggcggggagc ggctccggtg cgcctggtgg tctccgggcg ccgggccccc 
gccgtcgacc ggccgatgac cgtgcacctc tacgacgacg accggctggt cgaggaactc 
cgcaagctcg acggcaccga cagccaggtg ttcgccgatc cggagctgct ccggctggtg 

_^ + -^^^= = ^rr=. rr a rnnacrr.r. otoacaacct acgcccaccg cccgggggcg 

ccgctggact gccccctcac cgtgttcacc ggcgccgacg accccaccgt gaccgcggcc 
gaggcggcgg cctggcacga ggcggcggcg tccgacgtcg agacgcgcac cttccccggt 
ggccacttct- t cccgtacca. gcggaccgcg. gaggtgtgcg gggccctggt cgacacgctc 
gagccgctgc tgtcggccgg gacgcgcggt gtccggcggg tccgcccggg gtgacgtggg 
cacggtcgag tacgccgtcc accggcgtac cgcggaacgg gtgagggtct ccgccgacac 
cctggacagc ccggtcaccg cgctggcgga ggtgccccgc tggctggagg aataccaccg 
ggcgcaccgc ttccacgtcg agccgatccc cttcgaccgg ctccggcggt ggtccttcga 
gccgggcacc ggcgacctgc ggcacgagac gggccgcttc ttctccgtgg aggggctgcg 
caccagctcg gacgccgatc cggtcgcccg tgtccagccg atcatcgtgc agcccgaggt 
ggggctgctc ggcatcctgg cccgggagtt cgacggggtg ctgcacttcc tgatgcaggc 
caaacccgag cccggcaacg tcaacgggct gcagatctcc cccacggtgc aggccacgcg 
cagcaacttc gacgaggtgc accacggccg gtccaccccg ttcctcgacc acttcatcca 
ccgccccggc cgccgggtcc tgatcgacag catccagtcc gaacagggcg actggttcct 
gcacaagcgc aaccgcaaca tggtcgtcga gatcgacacc gacatcgagg ccgacgccgc 
gttccgctgg ctgaccctcg ggcagatccg ccggctgatg ctccaggacg acctcgtcaa 
catggacacc cgcagtgtgc tggcctgtct gcccaccgcg cacggcacgc cc sacgacgg 
tgacgactcc'ttcccggcgg cgctgcgccg ctccctctac ggggagaccg cgccgttgca 
cgatctgcac gccatcacca gctgcctcac cgacgtccgg gcgctgcggg tgctgcgcca 



5880 

5940 

6000 

6060 

6120 

6180 

6240 

63 00 

6360 

6420 

6480 

6540 

6600 

6660 

6720 

6780 

6840 

6900 

6960 

7020 

7080 

7140 



ccggcatcgc agcggcaggc atttcgagat catggcggtg gaggtgaccg cggagcgccg 7260 
tgaagtggcc tcgtggaccc agccgttgct gcgcccgtgc tcgcagggac tggcggccct 7320 
gatcacccgg cggatcaacg gggtgctgca cgccctggtg gcggcgcggt cggaggtcgg /3u0 



cacgctcaac gtcgccgagt tcggaccgac cgtccagtgc cggcccgacg aggcggacgg 7440 
ccagtcgccc ccgtacctgg accgggtgct gacggccgga gccgaccgcg tccgctacga 7500 
cgtggtgcag tcggaggagg gcgggcgctt ctaccacgcg cgcaaccgct atctggtggt 7560 
cgaggcgggg ccggagctcg acacgggctg cccgcccggc ttctgctggg ctaccttcgg 7620 
ccaStSIc? gaactgctcg cgcacggcaa ctatctcaac gtcgaactcc gcaccctcat 7680 
ggcgtgcgca cacgcctcct actgaatggt cacgaaagct gcaccgcgcg sgagaatcgg 7740 



cagcgcgcca ccggccggcc ggcacccgga aggtaaagcg ccgttctccc ^atcggcgc 7800 

7920 
7980 

tccggaaaag cgcgccccga gggcccccga atgccgggcg ggacggacgg cgactgcgcg 8040 



cctgcgggaa acggcggaac ggccggcccg gaccgcgcgc aattcccggc gggacacggt 
gggagcccgc acgaggaacc gctttccccg ccttcggtgc gcccggccgc gggaccaccc 7920 
ccgcctcccg gccgggccgc ggaatacgac gggggcggcc gaggacattc ctttcccgcc 7980 



8100 
8160 
8220 
8280 
8340 



cggacggcgg cccggcgtcg aacgcacctg cccgagtccg gacgagacag cgcgacgcga 
gaggcgaaaa tgatcaatct cttccagccc cagatggggg ccgaggaact ggcggcggtg 
tccgaggtct tcgacgacca atggctcggt cacggacccc ggaccgcggc gttcgagtcc 
gcgttcgccg agcacctcgg ggtcggcccc gagcacgtcg tcttcctcaa ctcgggcacc 
gccggcctct tcctggccct ggagtcgctc ggcctgcggc ccggcgacga ggtcgtgctc 
ccctcgccca gcttcctcgc cgcggcgaac gccgtacagc tctcgggagc gcgcccggtg 8400 
ttctgcgaca ccgacccgcg gacgctgaac cccgccctgg agcacatcga ggcggccgtc 8460 
accccgcgca ccagggccgt catcgcgctc cactacggcg gccaccccgg cgacatcgtg 8520 
cgcatcgccg agcgctgccg ggagcggggc atcaccctga tcgaggacgc cgcgtgctcc 8580 
gtggcctccc gcgtcgacgg ccgaccggtc ggcaccttcg gcgacctcgc catgtggagc 8640 
ttcgacgcca tgaaggtcct ggtcaccggc gacggaggga tgatctacgt caaggacccc 8700 
ggggcggccg cccggatccg gcgcctcgcc taccacggcc tcacgcggtc cagcggccg 8760 
ggatacgcca gggtctcggc gcgctggtgg gagatggacg tccccgaacc gggccgccgc 6 821 
gtcatcggga acgacctcac cgcggccatc ggcgcggtcc agttgcgccg gcttcccggc 
ttcgtggccc gccgcaggga gatcgtcgcc ctgtacgaca gcgaactgag ctcgctggag 
ggcgtgctga caccgcccgc gccacccgcg gggcacgagt ccacgcacta ctuctactgg 
atccagctgg cccccggcgt ccgggaccgg gtggcacgcg acctgctcac cgacggcatc 
tacaccacct tccgctacgc acctctgcac aaggtgcccg cctacggcca caccggaggc 
gaactgcccg gcgtggagcg ggcgtccgaa cggaccctgt gcctgcccct gcaccccggc 
ctgtcggacg ccgacgtccg caccgtcgtg tcctccctgc gcagagccct gagcgccgcg 
gatccggccc ccgcctgacg cgcgcacgcg ccacggcccc tgtcccggcg gtgaccgccg 
ggacaggggc cgtggcgcgt cctgcggacg gtccgggcca ccccgccgtc ccgtcggtgc 



8880 
8940 
9000 
9060 
9120 
9180 
9240 
9300 
9360 
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gtcagcgacg 
cgtccaggcc 
agtccacctc 
ccatccgggt 
ccggtgccgt 
accacggttc 
cgtcctccag 
cgtcgaacgt 
ggagccgctc 
cgtagagctt 
tggccgcgtc 
agtccttgcg 
tgggaatcct 
cgctcggggc 
acagttcacg 
gcccccgggg 
gccggaaatc 
ggttgaagag 
gcaacaccca 
accctctctt 
acgaacggtc 
ctttggtaaa 
aagggtccga 
cggcaccacg 
aggaccggat 
tcgagtaccg 
tcgtcgccgc 
tgctgaagct 
tgctgagcgc 
gcggactggg 
gggacaacag 
gcgcggtcct 
ccgaccgtca 
atctggccgc 
ggcaactgcg 
ccgacctcca 
tcgcgacggc 
cgctcgccga 
gccgggccgc 
tgcttcccgg 
ccgccgtccc 
acgacgactc 
cccgctcacc 
cgcacgtggt 
gcgccgacta 
tgctgctgcc 
accgcgccgg 
tcgccgacgc 
acggcggcac 
acgacgtccc 
gcttcacgga 
gtgccgcaga 
gcgtactgct 
tgcggctcta 
tgctcggatc 
gatcgcgccg 
gggcccgcgt 
gggcgccggt 
ggtagtccgc 
gctcgtccag 
ggcgctgccc 



cgtgccgagg 
ggccttgcgg 
gctgcggtgc 
ccgcccgccc 
ccgcagggcg 
gacggccagg 
gtcggccgtg 
ctcgccgagg 
ctcggcgcgg 
ggcgaaggcc 
cggcgtacgt 
gtcctggtag 
ccgggccgtg 
gggggcggcc 

ccgagccggg 
cggggcgcgc 
acggtgtggc 
gcagccttca 
ctgaaggacg 
gtcgaataga 
acctcggtcg 
gcacagggat 
agaagacgag 
gagcgaatac 
gcgccgactg 
ccgcgaccgg 
ccggcggggc 
ggacgtctcc 
cgacggcaac 
cgccatggtg 
cttcacgcac 
ggccgtcccg 
ggtgcggcat 
ggtggcgatc 
ccaggacatc 
gtcgcacctg 
cgccgaggcg 
gtacgggacc 
cgagaccggc 
gggcaacgcc 
cctgctcccg 
ccccaaggcg 
cacgctcctc 
gctggtggcg 
cgcgaaggag 
cggcgacgac 
gcaccccgtc 
gcaccgtgag 
cgcgtgcgcc 
cggttacatc 
tctggttccc 
gacactgcgc 
gggagaggac 
tcaggtgcgc 
gctgcgcgag 
acaggcgggc 
ggttcagccg 
gaaccgggac 
gagtgcctgc 
cagcagcagg 
gtaggacaga 



aagaagcccg 
tacgcggcct 
cggatgccct 
tcccgggtcg 
tgggtggaga 
acaccgtccg 
gtctccaggt 
tcgaacgccc 
gccgccatcc 
tccaggtggg 
tcccggatca 
agcaggtcgt 
aagggggaac 
tgccgccggc 
gtcaaggaac 
cggcgacgcg 
ccccgggcca 
accccggccc 
gccggatatc 
gtatgtcctc 
atctagacgg 
gggggtgcct 
tcggacgacg 
gaccggctca 
gagcgcttca 
gaggcggagc 
aaggacctgc 
tacgtcggcc 
gcggtcaagg 
cgcacctgcc 
gtcgaggccg 
ctgtgcgccg 
ctgacc'ccca 
gagcgcaacc 
ggcgaggccc 
gtcacgcagg 
ctcggcggcg 
ctgcgccccg 
cggcccacct 
ggcttcctgc 
atggtcgccc 
cagagccacc 
agggaacgcg 
gacggacccc 
ctcggcgggc 
cccgtcgccg 
accgtggggg 
gccgcgaagt 
tccgacctgg 
aggacgacga 
actctgaggg 
gtgcacccga 
tggcagtcac 
tcggcgctct 
tgacctctcc 
gttgaccacc 
gcgctgaact 
cgcatccgac 
tccaactcct 
tccatcgggt 
tccttcacgc 



gtgagccctc 
cgtactccgc 
ccgcggtgtg 
agtgggagac 
cgtggccgtc 
cggtcaggtg 
acccgatcga 
gcatgtcacc 
actcggacag 
taccggtgcc 
ggtcggtgac 
agacctcggc 
cgtgggtctg 
ccctcgcgat 
gacggggtgg 
cacggattcg 
ccgggtagct 
ggcctttatg 
ggccatgaag 
cgctgaagcc 
aatccttgaa 
gcgggatgag 
cactcgcctt 
tggcccgcgc 
accggctcgc 
tcgcggccct 
tggagtccat 
tgcacgagga 
tcgccgagag 
gcgctccctt 
tcgacgacat 
ggggcgaacc 
acgaggtcac 
ggctggtcga 
gcaccgccct 
tgatggacag 
gagccggcct 
tcgcccccac 
ccgtggcccc 
tgaccgacct 
gcaccctcgc 
aggagttctt 
ccctgatgtt 
gcgggacctc 
tgtgcagcgt 
tggcgcagac 
tcgcgggccc 
gtctggagac 
gtttcctcgg 
tcggccccgt 
tgtacctgga 
acaccgtctc 
cggagcgggt 
cctcgcaacc 
ggcacgggcg 
ggccaccggt 
cggcgatgcg 
ggtcgtgggt 
ccaccagcac 
cgctcaccag 
gtcgccgcag 



gcccgtcacg 
acgcgagaac 
cgcgatcagg 
acgggcgacg 
caggaaggtg 
ccgcgccatg 
gctgaacatg 
gcggtggagg 
ctccaggccg 
gcacgcgatg 
ccgggcggcc 
ggcactgtcg 
tcgaagagga 
gatctccgta 
tcagtcaagt 
gccaaccggt 
tatgcctcgt 
gaattcattt 
ccccggcctt 
gccgaagacg 
agcgtaatag 
tgacctgggt 
cctcgagttc 
cgaacgctcg 
cctcaccgcg 
ggtcgacgcc 
cgcccgcaga 
ggaccggccc 
ctaccggctg 
ctggaccccg 
cgtccgcgcc 
gatgggggtc 
cctgctgtgc 
ggagctccac 
cgcgcgcacc 
gcgcggcgcc 
gtgcagcccg 
ggaactgcgc 

gggggtctgg 
cggtccggac 
gctgcacctg 
cgacgacctg 
ctccctcagc 
gccgcggctg 
gcgggacggc 
cgccgccccg 
cgcctcgacc 
cctccgcgcg 
catgctcctc 
ggtcgactac 
gtcgggcagg 
acggcggctg 
gctggacata 
ggcgtccgag 
gcgccccgcc 
cccccgtacg 
cccgtctccc 
gacgaccacg 
cggggtgagg 
ccgggcgatc 
gtcggacggg 



acgtactcga 
agcgtgaggt 
tagtggatct 
ccctggtcgc 
tcggggaagt 
gcggcgacgg 
cagaccacgg 
gtgacgccgg 
ctcacgcggt 
tcgagcaggc 
tcacccgcgt 
ttctcgtaca 
gtgcgccgtg 
cggacaccca 
cgggcgctcc 
tgctcgttcc 
tcaccgcagc 
ccaccgtgcc 
tcagccaggc 
gacgaagggg 
cctgtcaatg 
tctggtgaag 
atcgcccggt 
ggcgccgacg 
cagtcgatga 
gcgcacgagt 
gcacggctgc 
ggcacggtgg 
ccggccgacg 
gactacctcg 
gaaggcctgc 
ctctacgtcg 
tcgctcgccg 
gacaccatcg 
cgcaggtccg 
gactcgttac 
ctcgggcgcc 
gcggcgtgcc 
acggtgcccc 
gcggaccaca 
cgcgtccagc 
atcggggcgc 
ttccgccgcc 
gaggcctccg 
gccgtcgtcc 
gagctgaccg 
gtcgacggca 
ctcggcggcg 
gccgaggaga 
gacacccacc 
agccccacgc 
gagcgcatcg 
caactggccc 
acccgggccg 
cgtcggcgcg 
acgaggtccc 
atggtcagcc 
acggcgccgc 
tggttggtgg 
tcgatccggc 
ctgaacaggc 



9420 
9480 
9540 
9600 
9660 
9720 
9780 
9840 
9900 
9960 
10020 
10080 
10140 
10200 
10260 
10320 
10380 
10440 
10500 
10560 
10620 
10680 
10740 
10800 
10860 
10920 
10980 
11040 
11100 
11160 
11220 
11280 
11340 
11400 
11460 
11520 
11580 
11640 
11700 
11760 
11820 
11880 
11940 
12000 
12060 
12120 
12180 
12240 
12300 
12360 
12420 
12480 
12540 
12600. 
12660 
12720 
12780 
12840 
12900 
12960 
13020 



1er depot 



cgagcgacag 
cccgcagcac 
ggcagccgac 
aggtggactt 
tcagggagtc 
cctccgcctc 
cgtggaccgg 
tcgcgccgtg 
tcttgcgcgg- 
cgagttcggc 
ccgtcaggta 
ggatcgtggt 
cgcggtggcc 
tcggttcgtc 
gggagcgttc 
cgaggccgtg 
actgctcgac 
tctcgtcgct 
ggtcggacag 
tctgcgccag 
ccacgcggcc 
cgccgacctt 
ggtagcgctt 
tttccacgat 
gggacgccac 
ggcaggcgga 
aactatagcc 
tgcagtcgga 
acagcggtct 
tggtccgcgc 
taccggtctc 
tggagatgcg 
acctcgggct 
tcggcgcgct 
tcacggtcgc 
ccgtcttcgt 
ccatcggccc 
ccgaagaggt 
acgcggtggg 
tcagcttcta 
acctggccct 
agccgggtga 
ccgggtacga 
tgcaggcggc 
gcgccaactg 
atgccacacc 
ccgcgtacag 
gcctgttcgg 
ccggctccct 
ccggcatcac 
agcactcctg 
cctccggggc 
cgcgcggtga 
tgcacccgcg 
gggtgcggca 
gcggacacga 
gcgacatcgg 
agcacctcgc 
tgcagcacca 
tggtgcggga 
ggcgtcgtcg 



cagtttctcc 
ggtcagtccg 
gcgcaccgag 
gcccgcaccg 
cacggcgagc 
cgggcccgcg 
gttctcggtc 
gtcgcgccct 
gatgccgtcc 
acgccactcc 
gccctcgtag 
ggtgagccgg 
ggccaggtgg 
caggagcagc 
gccaccggag 
cagcgcgacc 
cagagcggcg 
ctcgcccagc 
ggccaggtcg 
gtagccgacg 
ggcgaggatc 
ctcgcccggc 
cgtgatgtcg 
gaggatgagt 
cactgcggac 
gtcagctcaa 
gtgctacccg 
ccgggatgat 
ttcacgagag 
gtaccaccgg 
cggcgcggtg 
gatcgcggcc 
ccggaaggcg 
cacctcgccg 
cgccgggttc 
ggacgtcgag 
ccggaccagg 
ggcccgcctc 
gtcccgctac 
tcccgcgcac 
ggcgcggatc 
ggacaaccgc 
ccacaagtac 
cctcgggctg 
gcggcatctg 
gggcagcgat 
cagggcggcc 
gggcaacctc 
ggagaacagc 
cccggagatg 
aggggcggcg 
gtcacggccg 
gcagggtgcc 
ccaccaggct 
gcaggcggtc 
cgatcgcgtc 
ccttgttgac 
gcaccgaggc 
gatgcgcgtc 
ggtggcgtac 
cccgccgcac 



gcgtggtcct 
ggcgcccagg 
ccgccgtccg 
ttgggacctg 
cgacccgcga 
gtgtcgatgc 
agctgcgcca 
cgcctgcggt 
atccgcgcca 
tcgtactccc 
ccgttgccgt 
tcgaggaaga 
tcctccagcc 
agctccggcg 
agggttccga 
tccacgcgca 
tagcgctgga 
tccgcctcgg 
acggcgtcct 
ccgccgggag 
ttgagcagcg 
ttgatgctga 
tgtagggcgt 
ggatgcgtga 
atggccggtc 
cgccgggcat 
gtgccgcgca 
cgcttgtccg 
gggtcgacca 
gaacaggcgc 
ctgagcgagg 
ggcccggcct 
cacctgacca 
cagctggagg 
cccacgacgg 
ctcggcacgt 
gcgatcatga 
gcggacgagc 
cggggcaggc 
cacatcgcga 
gtggaatcac 
tgcctcaagc 
atcttctcgc 
tcccagctga 
cgcgccgcgt 
ccgagctggt 
ctggtcgacc 
gtgcggcacc 
gacctgatca 
atcgcctacg 
gtacgggggt 
cggaagcgtc 
ctccggcgtg 
cccctcgtcg 
gatcagttcc 
cggctcctgc 
gaccacgacc 
cagctgcgcg 
cgcgacctct 
gaagcccacg 
ggtcgtgtcc 



ccaggtagcc 
gcgtctcgtc 
gctccagttc 
tgacgagcag 
cgcgcacgtc 
gggcggcgaa 
cgcgttgctt 
aggcgccgtg 
cgttggaggf 
gcagccgccg 
agcgggtgac 
cccggtcgtg 
attccatcgc 
acgaggcgag 
gcttgcggtc 
cgtcggcctc 
ggccggcgga 
cctcgcgcat 
ggacggtggc 
cgaccacggt 
tggacttgcc 
aaccgacccg 
attgcgcaat 
gcgcgctcgc 
agggggtgtc 
cctcatctat 
acggtatgcg 
gcggccggat 
tgggcgatct 
ccgggggctt. 
aggaccggct 
cccggggctt 
actccggttc 
agagacggct 
tcaacccgat 
acaacacgac 
tcgcgcacgc 
gggagctgtt 
tcaccggctc 
tgggtgaggg 
tgcgcgactg 
ggttcgacca 
acgtcggtta 
cccggatcga 
tggacgggct 
tcgggttcct 
acctggaatc 
ccgcctacac 
ccgaccagac 
tcggcgacac 
gcgcgtggag 
cgaagctccg 
tgctcggtgc 
taggggatca 
cgcagctcgt 
tccagcagac 
tcggtggact 
ccggggtccg 
tcgatcgtgg 
gtgtcggcga 
agggtggcga 



ctcccggccc 
ctgccgcaga 
cccggacagc 
ccgttcgccg 
ggtgagttcg 
ggacaacggg 
cgcgttgcgg 
gccgaacacg 
gatcagcccg 
ctcgcgttcc 
gctgccggag 
ggtgaccgcg 
ccggtcgtcg 
ggtcgcggcg 
gcggtccagg 
gtagccgcca 
cagctcgcgc 
cgccgcttcg 
gtcgaggggc 
gagcgcgccg 
ggaaccgttg 
gtcgagcacg 
cgacacgcgt 
agaaagaacg 
acgagcacgc 
cacagagatc 
tgtcgcaccg 
gcctagcctc 
caggaaccgc 
cgttcccggg 
ggcgctggtg 
cgagcggcag 
ctccgccaac 
gcgtccgggg 
cttccacaac 
gcccgagcgc 
cctgggcaac 
cctcatcgag 
cttcggcgac 
gggctgcgtg 

ggggcgcgac 

gaagatgggt 
caacctgaag 
ggagttcacc 
gcccggtctg 
catcaccgtg 
gcgccggatc 
cgaccgtcgg 
gttctggatc 
gatccgggag 
gggaggaccg 
aggcgaggtc 
tgagcacctc 
cgacctccac 
cgatgccccg 
gggcgaggac 
cgccggcgcc 
ggtgcgaacc 
aacggaacgc 
tggtgtaggg 
acagggcgtt 



tgggcgaagg 
tgaccgaccc 
acccgcaaca 
ggccggatcg 
gccaccgcct 
tcggcgggag 
atccgcacca 
gagagggaca 
cggttgcggt 
acggccttgg 
tcgacctcca 
atcaccgtgc 
aggtcgttgg 
agcgcgaggc 
ctcggcagtc 
cgcgcctggt 
tcggagccgt 
agctcgcgca 
agttccagtg 
ttgtcgggct 
tcgccgatca 
acacagtcgt 
aagtctcctg 
gaaagcagaa 
tgctggatgc 
ccatgcgaag 
gccgacgtga 
gggagcaacc 
atcaccgagc 
acgacgcacg 
gagacggcgc 
ttcgcccggt 
ctcctcgccc 
gacgaggtcg 
gggctggtgc 
atcgagcggg 
cccttcgagg 
gacaactgcg 
ctgtcgaccg 
ctcaccgaca 
tgctggtgcg 
gacctgccgc 
tcgaccgacc 
gaggccaggc 
ctgctgcctc 
gacccggacg 
agcacccgcc 
taccgggtgt 

ggggtcttcc 

tgcgtgctca 
gggcggtcct 
ggggtggacc 
gccctcgtcg 
ctccacctcg 
acccgaacgg 
gtccgggtcc 
cacgtcccgc 
gtcgaccacg 
ctccaccagg 
gcgcccgctc 
ctccaccagc 



13080 

13140 

13200 

13260 

13320 . 

13380 

13440 

13500 

1-3 560 

13620 

13680 

13740 

13800 

13860 

13920 

13980 

14040 

14100 

14160 

14220 

14280 

14340 

14400 

14460 

14520 

14580 

14640 

14700 

14760 

14820 

14880 

14940 

15000 

15060 

15120 

15180 

15240 

15300 

15360 

15420 

15480 

15540 

15600 

15660 

15720 

15780 

15840 

15900 

15960 

16020 

16080 

16140 

16200 

16260 

16320 

16380 

16440 

16500 

16560 

16620 

16680 



1er depot 



acgccggctc 
agggcgaccg 
ttcagctgct 
gtctcgatct 
atctgccggg 
gccagcgcca 
atcagggccg 
ctggggctca 
cgcagctgcg 
tgcacgacgc 
agcgaactgt 
tcgagtcgca 
gcgacgcggc 
gcgtcggcgc 
tcctcgggat 
cgcgtccggc 
tcgccgtcgg 
gccatgtcgc 
gcaccgggta 
attatcgggg 
caccgggtca 
gtcaggggcg 
gacgcggtcg 
ctgtccgggc 
gcgcaggcgg 
ggaccggacc 
gaccggcact 
gacaccatgc 
cgccgggtgc 
gtcgccgtct 
ccgccggaga 
tcggccgcgg 
tggacggacc 
ggagcaccgc 
gacgcctggg 
ggcctgtccc 
gcggcgggct 
getcgcgtgt 
ctacacggtg 
cgcggcgtac 
caggatgttc 
ggacagccgc 
cgagccggtg 
gaggtgggcg 
ccggcggcgg 
cagcgcggcc 
tcggtagcgc 
cagctctccg 
gaggaacatg 
ggccgcgtcg 
cagcgccgcc 
cacgtcgggg 
gcccagggcc 
ggtggagagc 
gaagcgcagc 
agaagtaccc 
cgtggtgaac 
acccggcggc 
cggtgccccg 
gccgcccggg 
ctcggggcac 



cggtgaggcg 
acagcacctt 
ccagctcccg 
tcgtctcacc 
acagcgactg 
cctgcgcctt 
tgcggtccac 
gttccccgtc 
acgccttgcc 
cgtccagcac 
cggcctccgc 
gctggcggta 
ggagggaggc 
cggccatcgt 
gcgtcaaagt 
ctgcggggcc 
gggccggtgc 
cggggtgtgc 
ctgcgcccgc 
gttcacagtt 
ccacgttcaa 
accgcgaggt 
tggacacctg 
acgcggacac 
tccgtccggt 
acgccgacgg 
tcgcgggccg 
gcatgctcga 
tcgccccggg 
tcggcctcga 
agaacaccac 
agccggtgtg 
tgccgatgtg 
gcgcccgggc 
aggtcgtccg 
tgagccggga 
gacgcggccc 
ccgccccgcg 
aaggtctcgg 
gactcggcgg 
acgaagtgcc 
agtacggggt 
ctgccgtgca 
gccacgccct 
tcacggcgca 
cgcagcgggt 
atgtcgtcgt 
atggcaccgg 
aagttctcca 
gcgtggttgg 
gcggcccatt 
cgttccagca 
ttggcccggt 
agggcgggca 
accggggacg 
agggcggtca 
ggccggcgca 
ccgacgcgac 
cgtacccgct 
ttaggtgagc 
gccgttggag 



gttgagcagc 
gttgcgccgt 
gcggagcctg 
gggaccgcgc 
gccccagccg 
gccctcccgg 
gaccttgacc 
gcacaccacg 
cgagccgatg 
gagggcgccc 
ggccgfctccc 
ctcgacctcg 
ccggtcctcg 
gtcgtccatc 
acttccaatc 
gggcgcgggg 
cgtggaggtc 
aaggacgtat 
gggcgtgaag 
cgtgggccgg 
ccggggtgtc 
ggccggcgac 
cggttacgtg 
ctacctctac 
ggacgacgac 
tgactacggc 
gaccctgcac 
cgcctggctg 
caaccccgag 
ctgcctcgcg 
cttcggggag 
ggtcgacgag 
ggtgcccgac 
cgcgggtctg 
ggaccggccc 
gaaggagctg 
ccgaggagtg 
gcccggcggc 
cgcgggccac 
agacgtcctc 
ggtccacggg 
ggtggctgtc 
gctcgtacgc 

ggggggcggc 
gcacggcgcc 
agacgccgtt 
cggcgcgcgg 
cctccaacag 
tcagtaccag 
cggcggcggg 
cggcgtgcag 
gggcctcgta 
ccgcgtcgcg 
gggtgcgacg 
cttccggccg 
tggatggttc 
cacccacgag 
ggcaaggccg 
gacctgacac 
gcggcgcccg 
agaggagacg 



gatgacttgc 
cgctcctccc 
gccatcttgt 
gtggccatgc 
cgcagccgcg 
gactgggcgt 
ccgacgacct 
gtgtcggcgc 
tacgtcgccg 
gcggtctcgg 
gaggtccaga 
gagacgtcgg 
cggtctaact 
agtgcgtcgg 
tggggggttc 
ccggggggtc 
gctgccggaa 
cggcgatcac 
cgggcgagtg 
gccttcgccg 
agcggcaccg 
ctggagcggc 
ccccgcacgg 
gtctccagca 
tcacctgccc 
gtcctgaagg 
ctgcgggccg 
tggcgcatgc 
gtgggcatgc 
gacggccgta 
ttgctcacgg 
gggttcctcg 
accgcgcggg 
gcctgccggc 
gtcccggaac 
ctcgccgcct 
cgacgccgtt 
gcgtcctgtg 
gatctcgtcg 
ggcccggatc 
caggacgcgc 
cggggtcgtg 
cgagcggtag 
gagcaggacg 
ggtcaggcgc 
gtcgagcagt 
cgggatggtg 
ggctttgacg 
tccgcgctcc 
cttctccacg 
catgctgggc 
gggcgcgacc 
gctgccgacg 
gcccgcgatg 
cggcgggccg 
cgtcaatcgg 
tcgcttccgg 
atctgacaca 
tacgccgacc 
cggtgaccgc 
cgggtgacgg 



cggcgttggt 
ggttcacgtc 
cgttgatccg 
caccgccgcc 
gcagcatgta 
gctgcgcgaa 
cctccaggtg 
cggtctcctc 
ggtccggctt 
cgagcgccgc 
tgccgacgag 
tcagttcggt 
gatcgccgtc 
ctcgctgcgt 
gagagcgttc 
ggggccgacg 
ctcacatgcc 
ctccccagct 
tggatgtcat 
ccgaggcact 
acctgcccgg 
tggtgtccgg 
tgggggcctc 
tcgcctgcct 
acgactgccc 
ccggctgcga 
gtgtcatcct 
gcgtcgccga 
gcctgatcga 
ccggcgcctt 
agtgcgtcaa 
ccgagcacgg 
acaccctcgt 
ccttctccga 
tgccgctcgc 
gggacgctcg 
tcccgctcgc 
tcccggcgcc 
accagccccg 
accgcacggc 
tcctcccggt 
aagacgtggc 
ccgtgttcca 
ctgccggaga 
agttcgggtc 
gcgccgccgc 
aaggcggcgg 
gtggcgtgtt 
cgggccatgg 
aggacgtgtt 
accgcgatgt 
gcctcgcagt 
caggtcagca 
tcgccgcagc 
ggtgcggcga 
tccggatggt 
caatgggcgg 
gtgccgcgcc 
aatctgtgga 
gacgccggtc 
acgcgatcac 



gtagccggcg 
ccggccggtc 
ccgccggtcc 
accgccgccc 
ctgcatctgc 
gatgtccagg 
catcagctga 
gacgatgtcg 
ctgccggcgc 
cagctcggcg 
caccacccgc 
ggagagcccc 
ccattcctcg 
gccggcgaag 
cggggcgggg 
tgtccgcacc 
gtccacccta 
gacagagtgt 
gcgagtactc 
ggccgcgggg 
cgtcgaggcg 
aaggcactgg 
ggccgcggcg 
gcccgactgg 
gccggacgcc 
gcgcgccgtg 
cgggccgcac 
gggggagcac 

cgtacgcgat 
catcgtcaac 
ggccaccggt 
cgtgagtccg 
gtgggcggcc 
caccgtgcgg 
ggccggctgc 
cggcggtgcg 
ggggagcggc 
cggggcgcgg 
cctggcgcag 
ggaagaccga 
ggtcctggcg 
tcagggcgag 
tgccgaaggc 
ccacgacgcc 
cgaggaagtg 
cgatgtcggg 
agaaggtgcg 
gagagtggtg 
cgaacaggcg 
tgcccgcccg 
agacggcgtc 
cgaagtgcct 
cggtgccggg 
cgatcgctcc 
acggttcagc 
cacggcacag 
ccctgaagct 
gagggaccgt 
cggggcggtg 
cgaagcggcc 
gaccgagctg 



16740 
16800 
16860 
16920 
16980 
17040 
17100 
17160 
17220 
17280 
17340 
17400 
17460 
17520 
17580 
17640 
17700 
17760 
17820 
17880 
17940 
18000 
18060 
' 18120 " 
18180 
18240 
18300 
18360 
18420 
18480 
18540 
18600 
18660 
18720 
18780 
18840 
18900 
18960 
19020 
19080 
19140 
19200 
19260 
19320 
19380 
19440 
19500 
19560 
19620 
19680 
19740 
19800 
19860 
19920. 
19980 
20040 
20100 
20160 
20220 
20280. 
20340 



1er depot 



7 



gccgaccgcg aactggggcg cagactgcac cggatacgcg gcgtccactg gtatttcggc 20400 
aaccacggtg acccgtacgc cctcatcctg cgcggtcaga ccgacgaccc gtcggtgtac 20460 
gaggagcggg tccgcgaggg cgggccgctg ttccgcagcc gtaccgggac ctgggtgacc 2 0520 
gcggacccgg aggtggccgc ggccgtgctg ggcgactcgc gcttcggtgc gctggaccgc 2 0580 
gccggacggc gcccggagga gtacctccag ccgtcgcccg ccacgtacct crggactggac 206*n 
cgcgccgcgt acgcgcgtct gcggcgggtg gccgagcccg tgctgggcgc ggacgccgcc 2 0700 
gccgcgtggc gccggctcgg cgaggacgtc gggcgccggc tgctcgccgg ccgcggttcc 20760 
ggcctcgacc tgacggcgga cttcgcccgc cggctgccgg cattggtcct ggccgcgtgg 20820 
cfreggggtgc cgggcgaacg gtgcgacgag tgggaggagt. cgctgcgggc ggcggggccg 20880 
ctgctggacg gtctgctgtg tccgcagacg ctggcggcca cccgtgcggc ggactcggcc 20940 
gccgaggggc tgcgcgcgct gttggacgag gtggtcgccg cgcgtcccgg cgggtccggc 21000 
gagggtgcgg tggcccgcat ggtcggcgcc ggagccgccc ccgacgacgc ggtggccgcc 21060 
gccgtgtgcc tggcgctctc ggccgtcgaa ccgacgacga ccctggtgtg cgaagcggtc 21120 
cggctgctgc tcgaccgacc cgagtggtgg cggcggttgt gcgactcccc cgctctggcg 21180 
ccggccgcgg tccggcacac cctgcggcac gcgcccccgg tgcggctgga gagccgggtg 21240 
gcccacgagg acgtgacggt ggcggatcgt ccgctgcccg ccgggagcca cgtggtggtg 21300 
ctcgtgggcg cggcacggcg cgcgggcgcc ccggccgcgg agccggcgga cctggcgggc 21360 
gcaccggcgg cggagctgcc ggacgacctg tggttcgcgc tgtccgggga gttcgtcggc 21420 
cgtgccgccg agaccgcgct gggcgtgctg gccgaggccg ccccgggact gcggcgggac 21480 
ggcgacatcg tccggcggcg ccgttccccg gtcctcggca ggtacgcgcg gttccccgtc 215*0 
gcgtactcct gacgggcccg cggccggcgt cccctcagtc ccccacgacg tttcatgaaa 21600 
ggagtgccgt gcgcgtcctg gtgacctcca tcccgcacca cacgcactac taccacctgg 21660 
taccgctgat ctgggctctg cgtgcctcgg ggcacgaggt ggtggcggcc ggccagccgt 21720 
cgctggtcga cgccatcacc gccagcggca tcccggcgtt cgccctggcc gaggaggagt 21780 
cgctggcgca gatcttcgag gaggtcgagg gcgatctcca gccgtatcag cacggcatcg 21840 
acgagttcga cttcttcggc accctgaagg acgagctgga ctgggagaag ctgctcgccc 21900 
agcaggtgat cctgtccggc ctgtggctgg aaccgctcaa cggcgccacg accctcgaca 21960 
gcatcgtcga cttcgcccgg gcctggaagc ccgacctggt gctgtgggag ccgttcacct 22020 
atgcggggcc ggtggcggcc cgggcgtgcg gggccgcgca cgcccgcgtc ctgtgggggc 22080 
cggacacgat cgggccgctg cggacgaagt tccttcaggc ccaggcgcgt cagcccgagg 22140 
agcaccggga cgacccggtc gcggagtgga tgacctgggc cctggcgcgc tacgggtgcg 22200 
acttccggga ggaggacgtg ctcggtcagt ggagcgtgga cccgatggcg gagggcgtca 22260 
gtctgggcct cgacctgccg accgtcccga tgcgctacac cccgtacaac gggtcggcgg 22320 
tgatccccga ctggctgacc gaggaaccga aacggcctcg ggtctgcctg accctggggg 22380 
tgtcctcgcg ggagcacagt gaggacgagg tcccggtgca gaggtttatc gaggcgctgg 22*40 
ccgatctcga catcgagctg gtggcgaccc tggacgacgc ccagcgggac ctgctgccga 22500 
ggatcccgga caacacgcgc atcgtcgact tcgtgcccat ggacgcgttg ctgccgacgt 22560 
gctcggcgat catcaaccac agcggttcgg gcacgtgcaa caccgccgcg ctgcacgggg 22620 
tgccgcagat catcctcggc ggcatcctgg acgccgccgt acggcagcac atgttcgcgc 22 680 
agaactccgc cgccctcacc ttcgctccgg aggaggtgac cggcgcgtcg ctgaggagcg 22740 
cgctggtgcg cctgctcgag gagccgcggt tccgcgacgg cgcgcggcgg ctgaaggagc 22 800 
ggatgcgggc catgcccagc ccggccggga tcgtgccgac cctggagcgc ctcacggccc 22860 
agcaccgccg ggcgtgttga accggcgcgc gggcccgtgc cggcggtgac cgcccgaccc 22920 
gactctcgcg tgtgatcgat ctcgtcgact cagccgtgga ccggttcgcc tgtccgcgcc 22 9 80 
cgacactgga gtgctgatgc gggccctctt cacgaccgcg ccgctcgcgg gccacctgct 23040 
tccgctggtg cccatcgcgt gggccctgcg ggcggccggc cacgaggtac tggtggcgac 23100 
ccgggaggac ttcgtgccgg tcgccctgcg gtcggggctg ccgtccgcct cgtgcgggcc 23160 
gcccgccgcg gacctggcgg gcgcggccga ggcgggggcg ctcgcgcggc cccgcggagc 23220 
ggcggaggct cggggggtcc tgagcggggc gctggcgcgc gtcgcccggg gcagtctggc 23280 
gggggtgcgg cggctggcgg acgcctggcg gccggatctg atcgtcagcg aacgggccga 233*0 
gttcgccggg ccgctggtcg cggcggccct cggggtcccg tgggtccgct accactggtc 23400 
ggtctcgtcc ctggaggagt accggcgagc ggccgaggcc gagttcgcgc ccgagctggc 23*60 
ggcgctcggc ctcgaccggt tcccggaggc ggcgcgcgtg ctcgatccgt ggccggtgtc 23 520 
gctgcgccgg ccggacgcgg tcgcccacga cggggtccgg cacgtaccgg cccacgggga 23580 
cgcccccgtc cccgactggg cgttcacgcg cggtcgcggg ccgcggatct gcgtgacgct 23 64 0 
cggcaccatg ctgccccggt acggcgccgc cgggatggcc gacttcctga cggagctggt 23 700 
ggcggagacc cgcggagggg actgcgaact gctcgtggcg gtcgacgacg acgtcgtcgc 23760 
gcggtggccg tcgctgccct ccgcggtgcg gtacgccggc cggctgccgc tggcggaggt 23820 
gctgcccgcg tgcgacgcgg tggtgcacca cggcgggcag ggcacgtccc tgaccgcgct 23880 
ggccgcgggt cggccgcagg tcgtcatggc gcggctcgac gaccagttcg acaacgcgcg 23 940 
ggcactggcg gcggcggggg cggccctgct cgtaccgccg tcccgggcca ctcccgcggc 24000 
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cgtggccgcg gggtgcgccg aagtgctgga 
gctcgccgag gagatggcgc tgctgccgtc 
cccggggccc gggccggaca tgccgcggag 
atctggaagt actcaaccgt tcgaacgatc 
cgtccggctt catcgggtcc gccctggtcg 
gggcggtggc ccggcgcgag acccccgttc 
gccgggcgga cctcgcccgg ccggacgagg 
tcgtgcacct cgccgcccac atcggcggcg 
cgctgcgggt gaacgtcggt ctgctgcgcg 
ggcccgcccc ggccgtggtc ctggccagta 
agggcccgta cgcccggcag aagtcggcgg 
aggaggtggt ccgcggcgtc gtgctgcggc 
ccgggtggac gggccgcggg gtggtcgcgt 
cggtcacgat gtggcacgac ggcacggtcg 
cccgcgcctt cgcggcggcg ctcggtcacg 
tcggtacggg ccggctggag cccttgggag 
ccgagcggac ggggaggccc cccgtaccgg 
aggcgggcga cttcgagagc gcggtctgtg 
ggtctcccct cgttccgttg cgggcggggc 
acggagcgag gggtgggatc cgaacgtgag 
gctcggtcgc agcgcgaccc tggtgagccg 
ccgggtcgag gacggtgacg cgatgcagct 
ctgcatcgac accgcggaca tctacggctzg 
ggtgggccgg tggctggcca agagcgccgc 
ggtcggcggg gacatgagcg aacggctcaa 
cacggcctgc gagcagtcgc tgcggcgcct 
gcaccgcgtc gaccacgccg cgccgtggga 
ggcgagcggc aaggtgacct acgtggggtc 
cgcgcaggac gcggcccggc ggcgccagtc 
caacctggcg gtgcgccacg ccgagctgga 
gggcgtgttc gcctggtcgc cgctgcacgg 
cgcggcgggc gtcgcggtga agtcggcaca 
gcgcgcgacg atcgaggcgt .acgaggggtt 
ggtcggtctg gcctgggtgc tgtcccggcc 
cacggtggac cagctggact cggcgctgcg 
actggccgag ctggacgcca tcttcccgcc 
gtggatcagc tgaagggggt gcatcggccg 
cgacgtcgag cgcgggcagc gggaagacca 
cccgttcgac gaacccgtcc cggtagatcc 
gcgccttcgc gtcctcctcg gacacgatgg 
ccttctcctc gctcacctcg ccgatgcacg 
ggaggatgac gttgcccttg gtggaggcgc 
gggagcggtc caggaagccg cgcagggcgt 
cctcgaacgg tgccatgccg tccagtcccg 
ggcccgcctc gtccctcggg tgccgggaac 
cgccgtacac ctcggtgagc tcggcccgga 
actcgatctg gcgcagcgcg tagtactcca 
cggcttcgag catggcgggc aggtagctct 
ggacgtcgcg gacgtcgctc atgaagcgca 
tggaggtgac ggccttcgcc cgccgcgccc 
agtagtccac gaccaactcg gcgttcggcg 
ggtcgatgcc gaccagtcgc gggccgtcgg 
tgctgccgat gtcgaggacc aggtcgtccg 
cgaccttgcc atgcaggtgg tcgaccatga 
cctcgccgta catgaggtcc gggtcggggg 
ccggggaaca cgcgacgagt tccagcggga 
ggaacacccc ggtgagcgcc tgttcgccca 
cgcagacgcg gcacgcggtg gcaatcatgg 
ccggcccgtg gccaggtcgg gagcttccag 
cggcaccagg tgcaggcggc cgatcgcgcc 
gggatcgtcg gtgaatccgg cgaagcggta 



gaacgccctg tatgccaagg cggcagccgg 24060 
gccgtcggcg gcggtcggac tcctggaaca 2412 0 
ttacccgaac gaggatgcgg tgtgacgtga 24180 
cgcgcgggcc ggtgatcacg gtggtcggcg 24240 
ccgagctggc gcgcatgccg gtgcggctgc 24300 
ccgcgggggc acgggccgcc gtcgaggtcc 24360 
tcggggccgc cgtcgagggg gcggacgccg 2 442 0 
cgcggtcgtg gcgcgcggcc gacgagcggt 24480 
acgtggccga cgcgttccgg gaccgctcgg 24540 
ccctccaggc cggcgtcgag ctgtcccggc 24600 
ccgaggaggt cctgctgcgg gccgcctccg 24660 
tgccgaccgt ctacgggcgc agcccgctga 24720 
cggtggcacg gcaggccgtc tcgggcgagc 247 80 
ggcgcgatct gctccacgtg gaggacgcgg 24840 
tggagcggct ggacggcggc acgtggtccg 24900 
aggtgttctc ggccctcgcc gggctggtgg 24960 
tggtctccac ggagccgccc gaccatgccg 2502 0 
acccctccgc gttccgcgcg gtgaccgggt 25080 
tcggcgccgt ggtggagacg atggtggccg 25140 
cacggaccgg gagcaggccg cgcacacgcg 2 5200 
gctctggctg ggcaccgtga acttcagcgg 25260 
gatggaggcg gcggtcgacc gcggcatcaa 2 5320 
gcggatccac aagggccaca ccgaggaact 253 80 
gcggcgggag gacgtcctgc tggccaccaa 2 5440 
cgacggcggc ctgtcggcgc ggcacatcgt 2 5500 
gggcgtggac cacatcgacc tgtaccagat 2 5560 
cgagatctgg caggcgatgg accgtctggt 2 5 620 
gtcgaacttc gccggctgga acgtcgccgc 2 5680 
cctcggtctg gtgtccgagc agtgcctgta 25740 
actgctgccg gccgcccagg cgtacggact 25800 
cgggctgctc agcggggtgc tgcgcaagct 2 58 60 
ggggcgggcc cagctgctgc tgcccgagct 2 592 0 
ctgcggccgg atcggcgcgg atccggccga 2 59 80 
ggggatcagc ggcgcggtga tcggtccgcg 26040 
gtccctggac ctggtcctcg gggaggccga 26100 
cctgggcaag ggcggccggg cgccggacgc 2 6160 
acgtcacgcc ggccgatgcc gccggtcaca 2 6220 
gtcggccgcc gccgtcgagg aactcccgct 262 80 
agggcaggac cagcaactgg tccggcttct 2 6340 
ggatgcccgt cccgggggtg aaacgccccg 2 6400 
gcaggtcccg ttcggtgatc ccgcagtact 26460 
cgtacccgag ggtcagcagg ccctcttggc 26520 
cccgctggtc ggcgacgcgg cgggcgaagg 26580 
cggcggcctc ggcggcccgg atgcgggcca 26640 
cggtcctggc gagcgtgacg cacaggctgc 2 6700 
tgacggtgag gccgacgcgt tccgccatcc 2 6760 
ggtgctcgtg gcagacgatg tcgtacgcgt 2 6 820 
gctccatcat ccagacgccg tcctcggcga 26880 
gcgggtccgg caggtcgtag aacatcgcga 2 6 940 
cgaagcggtt ctcgaaggtc gcgcgggtga 27 000 
ggtacaggtc gcggaacttg ccgccggtcg 27060 
cggggtagcc cttgaggagc gtggcgtcgt 27120 
ggccgaggtc caccagccgg cggacggcgg 27180 
agggccggat gcccgagcgg tagccgtagc 27240 
tgtggcgcag ttgcacgagg ccgcatccgg 273 00 
ccgacggcac gacctcgtcg cggtcggccg 273 60 
ggtcgagtac ggagagcagc tccttgttgc 27 42 0 
ggtcctttcg ggatcctggc cggggcgccg 27480 
acggagggtg tcgggggcgg gccgggggga 27 540 
ggtggcggcg gaggcgtcct ggcacgggca 27600 
ggccacttcc atcatccggt tgcgttcggt 27 660 
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ggcccggaag tcggctccga ggtgcacccc ggcccggtgc gcctggtccg tcagccagcg 2772 0 
caggatcacc gtgccggccc ccagcgacac cacccggcac gaggtggcca gcagcttgat 27780 
ccgccaggcc tcggggccgc gccgcagcag cacgacgccg accgcgccgt agggaccgaa 2 7 840 
gcgatcggtg acggtggtga ccagcacctc gtggtcgggg tcgtcgatga gggcgcgcag 27900 
ctcgtcctcg gagtagtgca ctccggtggc gttcatctgg ctggtgcgca gggtcagttc 27960 
ctcgacc^gc gacagctcca ggggcgtggc gcggctgatc cgcatccgga tgtccagcga 2802 0 
gcgcaggaag tccgcgtcgg gtccggtgaa gtcggaccgc tcggcgtccc ggcggaagga 28080 
cgcctggtac atggagcggc ggcgggtcga gtcgacggtg acggtgcccg ggctgaactc 2814 0 
- cgggaggccg gteagccggg- tcgcetgctc ggcggcgtag gtgcggacct" ccggcagttc 28200 
gtgggtgacc tcggcccgtt cgaagggctg gtcgtcgatg aaggcgaggg tgctcggcgc 2 8260 
gaagttcagc cggtcggcga tctcgcggac cgacttcgac ttcgggcccc agccgatcct 2832 0 
cgggagcacg aagtactcgg cgacgccgag ctgttcgagc ttcgcccagg cgtgatcgtg 28380 
gtcgttcttg ctggccaccg cctgcaggat gccgcgcgcg tccagctcgg tgatggtccg 28440 
caggacgtcc ggggcgagcc ggacctcgtc ctcctcgagg agggtgccct gccagagggt 2 8500 
gttgtccagg tcccagacca ggcatttgac caacggctcg gcggcgttgt cccggtgcac 28560 
gtcgttccct tctctcgata cggcggttgc gaccgcgact cctcgacagg gcgtacgcgg 2862 0 
cccgcggccg gcggggacac gggccggttc acccggccgc ggacatcacg tgccgggcca 28680 
ggaccagttc gcagatctcg ttgctgccct cgatgatctc catgagcttg gcgtcgcggt 2874 0 
gcgcccgtgc gacgacgtgt ccctcccgcg ccccggccga cgccagcacc tgcacggccc 28800 
gttcggcccc gcgtgcggcg ccggtggccg cgacgtgctt ggccaggacg gcggcgacca 28860 
ccatgtcggg gctgccctcg tcccactggg cgctggcgtg ctcgcacgcc cgggcggcgt 2 892 0 
gctgttcggc gacgaacagt tcggcgaggt gccgggcgac gagctggtgg tccgagagcc 2 8980 
gcgtgccgaa ctgctcccgt ccgccggcgt gacgtgcggc ggcggccagg caggcgcgca 29040 
ggatgcccag ggagccccag gccaccgaca tccggccgta gctcagcgcg gtggtgacca 29100 
gcagggcggg ggtgcggtcg tggccctgga gcagggcgtc tgccggcagc cggaccccgt 29160 
ccaggtggat gtcggcgtgt ccggccgcgc ggcagccgtg cgcgtcggtg atgcgctcga 29220 
cgcgtacgcc gggggccgag gcgggcacca cgacggcgcc cgcgccctgc tccgtgcggc 29280 
cgaagaccac cagcaggtcc gcgtacgcgg cgttggtcgc ccacaccttg acgccgtcga 29340 
cgacgacttc gtcgccgtcg gaggtgatgc gggtgcgcag ggcggacagg tcgctgccgg 29400 
cgccggcctc ggtgaacgcc acggcggcca gttcgccgcc ggtcaaccgg ggcaccaggg 29460 
aggcctgctg gtccgctccg gcgagccggc gcagcgtcca ggcggccatg ccctgcgagg 29520 
tcatgacgct ccgcaacgag ctgcagaggg cgccgacgtg cgcggtgagt tcgccgttgc 295 80 
gccggctggt ccagccgagg ccgccgtgga ccgcgggcgc ctgtgcgcac agcaggcccc 29640 
gggagccgag gtcgtgcagc aggccgaggg gcagctcgcc cgtccggtcc cactcggccg 29700 
cccggtcgcc gaccagcgcg gtgaacagct cctcggcctc ggtgccgtcg gcgtgggagg 29760 
tgtcagccac ctgcgtgccc ggtcgcctcg ccgggcgcgg ccagccgtcc gaccagccgg 29820 
accatcgcgt cgacggtgcg gaagttgtcg agcatcaggt cggcgccgct gatgacgatg 29880 
ccgtaggtct tctccaggtg cacgacgagc tgcatggcga acagcgagga catcccgccg 29940 
acggcgaaca ggtcctggtc gcgctcccag gtggtcttgg tgcggtcctc gaggaacccg 30000 
agcagttccc cggcgacctc gtcggcggtg ggggtcgtgc cggtggggtc gggccgaccg 30060 
gacgtcgtgg tcatcgcgtg gcctcctggt agtcgtagaa tccccggccg ctcttgcggc 30120 
cgagcaggcc ctggcggacc ttgtccagca gcagctcgct cgggcggagc gccggatcgc 3 0180 
cggtccgttc gtgcatcacc cgcagcgagt cggccaggtt gtccagtccg atcaggtcgg 30240 
ccgtggccag gggtccggtg cggtggccga tgcagtcgcg catcagcgcg tccacggtct 30300 
ccggggtggc ccggccctcg tgcaccaccg cgatggcgtc gttcagcatc cggtgcagca 3 0360 
ggcggctggt cacgaagccg gcgccgtcgc cgacgacgat gccccggcgg cccaggccgg 3 042 0 
acagcaggtc ccgggtggcc cgggcggccg cctctccgct gcgcggtccg aggaccacct 30480 
cgaccgtggg gatcacgtac gcggggttca tgaagtgcac gccgacgagg tcctcggggc 30540 
gggggacggc gtcggccagc tcgtcgatgg ggacgcccga ggtgttgctg acaagcagcg 30600 
tccccgggcg cgccacggac gccaggtccg ccagcacctc ggccttccgc tcggggtcct 30660 
cggtgacggc ctcgatcacg gcggtcgcgg tggcgacggc ggccggcgcc t'cctcgacog 3 0720 
tcagctcccc gggcgggcgg tcgtggggca gcgcgcccat cagccgggcc gtccgcagat 30780 
gcagcgcgac cgcgtcgggg gcggccgcgc gcgccccggc ggaggtgtcg accagtgtga 3 0840 
ccgggtgccc gtgtccgacg gcgagtgccg cgatggccgt gcccatgacg cccgcgccga 3 0900 
gcacgacgag cggagaattt tccttggaat cgggcacgga tec 3 0943 



<210> 2 
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<400> 2 

ctgcaggcgc gcgggctgct cgggcaggag 
gacgactact gcgcgcagat ccgcgaggtc 
tggtccatgg gcgggctgct cgcgcaccgg 
cgcgtcgacc tgctcgcgat cgtcgacgcc 
gacgcggcgg agatggtggc gcggatcggt 
ggccccggcc aggaggaggc gctgctcgcg 
catctgccgg gcggtgacat cggcgcggcg 
acgaggaacc tgcggcccga ggcgttcgac 
tcgttcgccg aggacgacca ggttcacgac 
cagatcaccg agcacgtgat cgaccacctc 
gtcacggcca tctccgacgt gctcgtcggg 
tccggcgcac cccgcgcacc tcgcgcatcc 
gttcgaggac acggaagcca cctacgtcgt 
gtggccgtcg ttcgcggagg tcccggcggg 
gcagtcgtgc ctggactaca tcaacgagaa 
cgaggcgatg gcgacggccg ggcaggacgc 
gtcggcgtcc gcaagagctt gcggcgacgt 
cgaacggggc cgggtgctcg ggctgctggg 
gaacatcctt gccacggtct ccccggcgtc 
cgtcgcgacg cagggcgccg agatccgcgc 
ggtggacgag tacctgagcg gattccgcaa 
gggacggcgt gaggcggcgg cccgggccac 
ggcggcccac cagccctccc gcacctactc 
cgccagcctg gtcggccggc cggacgtgct 
cccggcgacc cggatcgccc tgtgggagac 
cgtcctgctg accacccagt acctggacga 
cctgtcgaag ggccgggtgg tggcctcgga 
ccaccggtcg gtgcgggtgg tccttccgcc 
gctcaccgcc ggcgggttcc gtccgcggtc 
cgtggacacc tcggccggta tcgcgggcgt 
ggccgtcgag ctgaccgtca aggagccgtc 
tccctcaccc gccgccgacg cggcctgatc 
cgccgtgaag gaggtggcgg tcgacaccgg 
cggcctcggc acccagctgt gggtactgac 
ccgccgcctg gcgctgttca gcctgatgca 
gatcttcggc agcatggccg acccggacga 
cgtggtgccc gcgctgctgg tcaccaccgg 
cctggtcagg gacatggaca acgggatggt 
gttcctggtg ctggtcgccc ggtcgctggc 
cgtcctcgtg gccgtcggtg tgatcctgct 
cacgtccgcc gccctgttgc tcaccctgtt 
cgccctcgcg gcgtggctgc gcagcgtgga 
gttcccgctc atgttcgcct ccagtgcgtt 
gcgctcggtg gcgcacctca accccgtgac 
gctggactgg gacccggggt ggagcgtgcc 
ggcggtgggg atgtacgtcg ccgggcgttc 
gcgaacgggt ccgtcgcctg cccctccggg 
cggtcggccg tccgcccgta ggcgcggaag 
ttgacccggt cggccggcct cacgcccgcc 
agcaccttcc gcgcggcgtc gcccaccgtc 
aaccgctggt aggcggcctt ctcacgccag 
atcagggtct gggtgtccgc gcgcggtacg 
ccccggtcga acgagtacca cggctcccac 
ccggtccgct ttcccacgta ctcccgctgc 
ggacccatgt cgaggcagcg cctcagcatt 
atgagtctga ccggctgccc gggcagttgc 
acgtccggca gcgattcggc ggccagccgc 
agtaaaggcg tcccgggtga ggcgagcact 
tcgacggtca tcaggtcatt cggagaatcg 



gcgcccgccg agagcctcga cgcgatgatc 60 
cagcccgagg gcccgtaccg gctgctcggc 12 0 
gtcgccaccc gcctccagcg ggcggggcag 180 
tatccgcccg cctcggtgcg ggccgactgg 240 
gaggaactgg gcttcgacgt ggaccgggtc 300 
gatctgcggg cgaaggggca tcccctgggg 360 
gtccgcgtgt acgtcaacag ctcgcgcctg 42 0 
ggggacgtcc tcttcttcgc ctccgggacc 480 
gtcgccgcct ggcggccgta cgtcaccggg 540 
cacgaggacc tcttgatcga accggccgcg 600 
catctgcccg cggacgacac accccgcgcg 660 
cgatgaggaa ggaaacatca tgagcaaccc 72 0 
gctggtcaac gacgaggggc agcactcgct 780 
ctggtccgtc gtggtgccgg agacggaccg 840 
ctggaccgac atgcgcccca agagcctcgt 900 
cccttgagcc aggacgccat gatccgggcg 960 
ccacgccctc gacggcgtgg acatcgaggt 102 0 
tcacaacggg gccggcaaga cgaccttggt 1080 
cgcgggcacg gtgaccgtcg ccggtttcga 1140 
gcgcatcggg gtgaccggcc agttcgcgtc 1200 
cctcgtcctg atcggccgcc tcctcggggc 1260 
cgagctcctg gagctgttcg agctgaccgg 1320 
gggcgggatg cgccgacggc tcgacctcgc 13 80 
gttcctcgac gagccgacga ccgggctgga 1440 
ggtggagaag ctggtggcgg gcggcacgac 1500 
ggcggaccgg ctggccgact ggatcaccgt 156 0 
caccaccgac cggctcaagg ccgacctggg 162 0 
cgccgccgac ctgacggccg ccgccgccgc 1680 
cgacgccggg gagcacgcgc tgaccacgcc 1740 
catccgcgcg ctggacaccg tcggaacgca 1800 
cctggacgac gtctacctgg cgctcaccca 1860 
cccaggagtt ccgttggcca tccaggagcg 1920 
taccccggcc ggccccgtgt ggcgtggtgc 1980 
cgcgcggcag atccgttcca tgtacggcga 2040 
accggtgatc atgctgttgc tgctgagcga 2100 
cttcccgcag ggcgtgcgct acatcgacta 2160 
catcggctcg gcccagggcg cgggggtggg 222 0 
ggcgcgcttc cgcgtcctgc cggcccggct 2280 
cgatctggtc cgtgtgttca ccgagttggt 2340 
gggcttccgt ccggccgggg gtttgtgggg 2400 
cgtcatctgg tcgctgatct gggggttcat 2460. 
ggtgatgtcc agcctcgcgg ttctggtgat 2520 
cgtcccgctg gacgccctcc cggagfcggct 2 580 
gtacgcggtc gacagcgccc gccgcctggc 2 640 
cggcgcgctg ctgaccagca ccgcgctcat 2700 
cttcaagagg cccccgaacg aatgattccg 2760 
ctcgcccggg ggaggcgggc gcggtctcag 2 82 0 
agtgcggtcc actccgggac cgtgaggtcc 2 880 
ccgcgcacga actgggcgtg tccgcggcgc 2940 
atctggccgg tgtcgaagac ccgttggacg 3 000 
ggcacggacg gcctgcggtg cggggcgacc 3 060 
ggggtgaagt cctggcgtga gaaggccagg 312 0 
tgggcgttga agaggtttcc gccccaggct 3180 
aacaggaaca cgccctgccg catgcgcgcc 3 24 0 
ctggtgccgg tgacgaaggg aagattcccg 3300 
agggtcagga aatcctcgtt caccaccgtg 3360 
cgagcccagc ggggatctat ttccaccgcg 3420 
ttggtcaccc gccctgatcc cgcgcctatt 3480 
ggcggaatgg tgtccgaacc gtccagctga 3 540 
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gcggagaaac gacaggccgc ggcggctgta cgaaagaagt tctgacccca ttctctccgc 3 600 
gcggtgctgc gtgaatcagc gggtgcggag acggattgcg gtggcagtgg ggatttcaat 3 660 
gtcacctcgg cgacattacc aagtcttgac ccaacggtcc atcaaccacc ggtatacccc 372 0 
atgcaattca gccaccgtcc ggcccgatcc cgacgttcgg ccgcgggcct ttcgggcccg 3780 
accggtgacc agcgcgcgaa ccggagttcc cggcgatatt tccggctcct ggcgactcgc 3 840 

r»» rrt" r*rr fr* r-*rvt-*rxrxr*<-*rxrx r«ri/v/-r/-i/-r,-(^-,f- _ +_ ^ ^.^.^ — onnn 

~ v ~ , ^ v-wyyyyy^vjvj ^^aa^a^^-" 1 - ya.v.c^^ya.L.y yyyy^yc 1 !' 1 -^ ^uyyuuya^L. jjuw 

tcgtcaggtc cggagggtcc cccgggcggc gcgggccgat ggccgctgac tgtgtcatct 3 96 0 
gcgggttgtc ggccgaacac accgcgcccc aggatgactc agccgttcct gcggtcgtcc 402 0 
.cgaccccggt cccacccccg. aaaagaggag-cgagaatcca -gtgctccage gcg-tegatct- 4080 
gtcgtcactc accggcctcc gctggtatgc ggcgctgacg gtattcgcct gtcacatcgc 4140 
ccagcagggc ttcttcgccg accagcaggt gggcagcgca ctgctgcaca tcaccccgct 42 00 
cggttccatg gcggtctcga tcttcttcat actgagtgga ttcgtcctcg cctggtcggc 42 60 
ccgcgacgag gactccgtgc cgactttctg gcggcgccgc atcgcgaaga tctatccgct 432 0 
gcatctcgcg acgttcggca tcgcggctct catcattttc tccctgtcgg agccggtact 43 80 
tcccggcggt tccgtatggg acgggctggt gcccaatgtt ctgctcgtgc agtcctggct 4440 
tcccgacgcg accctcacgg ccagtttcaa cacgcccagc tggtcgctct cctgtgagat 4500 
cgccttctat ctgtcgttcc cgctgtggta ccggctggtg cgcaggattc ccgcacggcg 45 60 
gctgtggtgg tgcgccgcgg ggatcgccgt ggccgtgacg tgtgtgcccc tgctggcggg 462 0 
cctgctcccg gcgagcgagg aggtggcccc cgggatgtcg ctcaacgagg tctggttcgc 4 680 
gtactggctt ccgccggtgc gcatgctgga gttcgtcctc ggcatcgtga tggcgctgat 4740 
cctgcgcgcg gggatctgga agggccccgg tccggcggtc tgcacggcgc tcctcgccgc 4 800 
gagttacggc ctcacccaga tggtgccccc gatcttcacc ctcgtcgcct gctccgtcgt 4860 
accggccgcg ctgctgatca cggcgctggc cgacgccgac gtgcacggcc ggcgcacggg 492 0 
gctgcgttcg gcgacgctgg tgcggctggg ccagtggtcc ttcgccttct acctggtcca 4980 
cttcctgatc atccgctacg gacaccggct gatgggcggc gatctgggct acgagcggca 5040 
gtggagcacc ccggccgcga tcgcgctgtc cctggggatg ctgggggtgg cggtcctggc 5100 
cggcggtctg ctgcacaccg tcgtcgaaca gccctgcatg cgcctgttcg gcagccgcag 5160 
gtccgcctcc cgtccgaagc ccggcgccac cgcggctccc cggaactcac ccgcggccga 5220 
cgcggccggc gtgcccctgc tcccgggcgt acccgggccc gcgcacaccc ccgcagcgac 5280 
gaacgaaccc accccgagag gatgatgagc gtggcagacc agacggctct cagccccgcg 5340 
ctgctggagt acgcccggag cgtcgcgctg cgggacgacg gcctgctgcg cgaactgcac 5400 
gaggtgaccg ccgggctccc cggcggccgg gccatgcaga tcatgcccga ggaggcgcag 5460 
ttcctcgccc tgctgatccg gctcgtcggt gcccggcggg tgctggagat cggcaccttc 5 52 0 
acggggtaca gcacgctgtg catggcgcgg gcactgcccg ccgacggcac cgtcgtcacc 55 80 
tgcgacatca gcgacaggtg gcccggcgtc ggcgcaccgt actggcgccg ggccggggtg 5640 
gagtcccgga tcgacctgcg cgtcggcgac gccgtccgga ccctcgccga gctccgcgag 5700 
cacgaggggg acggctcgtt cgacctggtc ttcgtcgacg ccgacaagac cgggtacccg 5760 
cactactacg agcaggcgct ggccctggta cgccccggcg gactggtggc ggtcgacaac 5 820 
accctgttct tcggccgggt ggccgacccg gccgtcgagg acgccgacac cgtcgccgtg 5880 
cgcgcgctca acgagctgct gcgcgacgac gaacgcgtgg acatcgccct gctgacggtc 5940 
gccgacggga tcactctggc ccgccggcgg gagtgagtcc gcacggggtg cggagcacct 60 00 
ggtgccgtca ccggcccgca cacgtccgcc gccgacctgc ccgggcaggt cgccgagctg 6060 
ctgccctggc gtggccggcc ctcgtcgagg gccgcgcggt cagcggaacc ggttgatcgc 612 0 
gtcgatgtgc cgcgcccgct tctcctcgtc gcgcacgccc agcccctccg tgggcgccag 6180 
gcagagcacg ccgaccttgc cctggtgctg gttgccgtgc acgtcgtgca cggcaaccgc 6240 
cgtgtcggcc agcgggtagg tgcgcgagag ggtggggtgg atcctcccct tggcgacgag 6300 
ccggttcgcc tcccacgcct cgcggtagtt ggcgaagtgg gtgccgacga tacgcttgag 6360 
gtgcatccag aggtagcggt tgtcgaactc gtggcggaag cccgaggtgg aggcgcaggt 642 0 
gacgatcgtg ccgcccctgc gggtgacgta gacggacgcc ccgaaggtct cccggccggg 6480 
gtgctcgaag acgatgtcga cgtcctcgcc cccggtgacc tcgcggatgc gcttgccgaa 6540 
gcgcttccac tcccgcgggt cctgggtgtc ctcgtcgctc cagaagcggt agtcctcggc 6600 
ggagcggtcg atgatggcct ccgcgcccat ggcccggcac acctcggcct tgcgcgcgct 6660 
ggagaccacg cagacggggt gggccccgcc ggcgagggcc agctgggtgg cgtacgagcc 672 0 
caggccgccg ctggcgcccc agatcagcac gttgtcgccc tgcttcatgc cggcgccgtt 6780 
gcgggagacc agctggcggt aggcggtgga gttgaccaga ccgggcgcgg cggcctcctc 6840 
ccaggtcaga tgggccgcct tgggcatcag ctggttggac ttgacgaggg ccacctcggc 6900 
caggcccccg aagttggtct cgaagcccca gatgcgctgg gccgggtcga gcatggtgtc 6960 
gtcgtgcccg tcggggctct ccagctccac cgacagacag tgcgcgacga cctcgtcacc 7 02 0 
gggtttccag acgttcacgc cgggtcccgt gcgcagcacc acgccggaca ggtcggaacc 7 080 
gaggatgtgg tacggcaggt cgtggcgcgc ggccagcggc gaggtgcgcc cgtagcgctc 7140 
caggaagccg aacgtcggga ggggctcgaa gatggaggac cagaccgtgt tgtagttgac 7200 
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ggagctggcc atcaccgcga ccagcgcctc 
gtcgacgtgc agggacttgc gcgggtcctt 
ggtgtcctct ttgcggacgg tcacggcgcg 
gtcctcgggg gtgcggtccg cggcggtgat 
ttcgggcatg gaacggtctc cgatcgctcg 
aggcgctcca gggtggggat gatcccggcg 
agccgccgcg cgcccgccct gatcgcgggg 
agaccgcgcg ccgtgagcgt cgccgcgggc 
tgctgcgcct tgagcggcgc gtcccacagg 
cgcagggcgg tggaccaggt gcccgctccg 
agcagcgcgt cgagcggtac gaagtccacg 
cggtcgagct gggaggtgtc cagggtggcc 
tccagcagtt cggagtagga gaccgcgtcg 
agggtgaggc agacgcgggg gcggtcgggc 
cgcccgttgt agggcacgta gcacatgggc 
ctgcgcgggc ccgggtcgat cacccagtgg 
ccgtaccggt ccagcgtcca gccgagccat 
ggcatcccgt cgagggcggc gaggaagcgc 
cacaggatgc gcgcgtgggc ggcaccgcag 
cagggttccc acacgaccag gtcgggccgc 
atcgtggcgg cgccgttgaa cggggcgaag 
agcaggtact cccaggtggt ctcctcctcg 
tggtagggga cgaggtcgct gcccatctcg 
cccaccggta cggcggtcag gccggtggag 
gccacccgta cctcgtgccc ggcggcgcgc 
tagtgggtgt tgtgggcgag ggatgtcagc 
ggggcgtacg gacggcgggg tcatcccggg 
accggtgacc gcggccgggt caggggcggt 
gccgtgacct ggaccgcggt ggtggcggcc 
tgcggtccgt cggcgccccc gagcggctcc 
agcaccacga cgtgctcgtc ggcggtgatc 
gcgacccggt tctccagccg ggccgggggg 
gccgcggccg gcgtccggcg ggccctctcc 
accgtgtgcg cgacggcggt gacgacgggt 
atgcgctcga cgtcgccggg ggcgacgccg 
ggccggggct cggcgttccc gaggccccgg 
tcggccagtg tgcggacggc gtcggcggac 
atccgggcgt cgagctgggg gccgcaggcg 
cggcccggca ctccgaggag cctgagcatc 
ccgacaaggt cgaacccggc gtcaccggtg 
gtggtgcgcg ccgcgcaggg cgcctgggcc 
agcgcccgca ggcgtacgag ctccgcgcgt 
agcagttcct egtccgggcg gcgtccggcc 
aggacggccg ccgccacctc ggggtccgcg 
aaccacggtc cgcgggcccg gatctcccgt 
aggatcagcg cgtacgggtc gccctggttg 
tggagccgac ggccgagcgc acggacgccc 
gcgggggccg tttccgtggc aagggtgggc 
tgggggcgct cgcacgatcg ggggacccgg 
ccgggccgcg gcggtccgcg tcggcaccgg 
gaccggacgg gccgccttcc tggtagacca 
cgtagtcggc gcgcgggaac agggtgatgg 
cgggtccggc gaggaggtag tgcacctcga 
gcgagacccg gcagacggtg cgctcgcccg 
gggtgaagga ctcggggaac caccagggtt 
ggtcggtgaa ggcccgcagc gtgctgtcga 
agctgaacat gcaggtcacc gcgtcgaacc 
cttggtggaa ggtgacaccg gggttccggc 
gttccaggcc ctcgacgtgg tcgaagaggc 
cgcaggccac gtcgagcagg gtccgggcgc 
tctcctcggc ctcctgccgg tagtccttcc 
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cccgggcccc acttcgggca gcggcacctc 72 60 
gtccgcgctc ggcatcccgc ggaacatgtc 7320 
gaaggactcg ggcaggggca gcgccgcgat 73 80 
cgcggcgagc agcgcgctct gcgcatggct 7440 
tgtcgtcagg tggcccggtg cagggcggtg 7500 
ggcgtggggt cggcgagcat ctcctcgctc 7560 
tcgtgcacgg ccgtgtgcac cgcgtcggcc 7620 
aggtcgaacc cggcggacag gcgctggagt 7 6 80 
gagggcagca ggatctgcgg cactccgtgg 7740 
ccgtggtgga tgatcgcggc gcagctcggc 7 800 
ggcacgacgt tgtcggggag ggtgcccagg 7 860 
accacctcga tgtccagccg gccgagcgcc 7920 
cggccgtagg tctcgcgggc ggacacgccg 798 0 
ttcttgccga gccagggttc gatcacggag 8040 
accgtggtct ggcccaggtc gaggcgggtg 8100 
ccgagcacgt cgcgttcgtc gaaggcgagc 8160 
tcggcgatgg ggtcctcgcg cagttcctcc 822 0 
aggcgggagc gtccgatggc gtcggggccc 82 80 
gcgcgggccg cgaccggccc cgcgtaggtc 8340 
cagccacggg cgaagtcgac gatctcgtcc 8400 
cacagggcgg ccatcatgct ctgctggccg 8460 
ctctccacct caccgaactc gaagccccgc 8520 
gcgagcagct ccgcggccgg tcggtcgtcg 8580 
gtgatgacgt cggtgaggga gggcgggctc 8640 
agcgcccagg cgaggggcac cagactgtag 87 00 
aggacgcgca cagcggctcc ggtctgggag 8760 
tggacccgga ggcgggcgca ggcgcccagg 882 0 
ccctcggccc gcaggccggg caggcggccg 8880 
aggcggatca gcgggagggc gagcgccagg 8940 
ggcccgggga tctcccgtcc ggcggcggcc 9 000 
cggcggccgc cgagttcgag gccggtgtgc 9060 
cgctcgcgca gcacctggtc gacggcgttc 9120 
cactcccccg gccggccgag cagccggtgg 9180 
tcgggtgcgc cgaccgcgag gagcagcgcg 924 0 
tcgtgcagga ggagggcgag cacgtcgtcg 93 00 
gacttctccg cgacgagctc ggggaccagg 9360 
tcccgggcca cggtcagcag ttgcggggcc 942 0 
gcgagtgccc gcgcggcggt ggcgcggtcg 9480 
agctcgacgg cgtagggccg ggcgacctcg 9 54 0 
ggcagcaggc ggccgagcac tctgcgggcg 9600 
ggggcgtacc ggctgagcac cggggcggcc 9 660 
tcgtggtggg ggaacgcctc ggcgaggggc 9720 
cggtccagcg tgccgaagcg cgggtcggcc 97 80 
gtcacccagg cgtccagctg ttcgctgcgg 9 840 
tcgaacggct cggggtcggc gacggcgcgc 9 900 
ccggcgcacc agtgtgcggc ccgggtcagc 99 60 
gtgctcgtgt ccgcgctcgt gctcgtgctc 10020 
atggctgccc tgcctttctt ctcgggtcga 10080 
gtgtgccggg tgggtcgggg caacccgcct 10140 
gtcagcggcg ggtgccgatg aacagcccgc 102 00 
cgtcgcagcc ggcgcgctcg aaggccgcct 10260 
tgtggtcctc ggtcaggtga cggacgccgc 10320 
tgcgggtggc gttcccctcc cgtacggagt 10380 
cctccgtgat gctggcgccg acgtaaccgg 10440 
cgacgacgat gacgccggac ggttcgaggt 105 00 
gttcgtcggt ggtccgcagg tggcctatgg 10560 
ggcgtcccag ggagaacgag cgcatgtccc 10620 
cggtcgcgag ggccagcatg tcggcggaga 10680 
cgtccaggtg gtgcaggtgc tggccggtgc 10740 
ccggccggtg gacgcgcacg agtgcggcga 10800 
ccttcccctc gtggaccagg tcgtagacgg 10860 
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ccgcgatgtc gtcggcgtac atcagtgttt 
gtgcgggagg ctgtccagcc attcgtgcac 
gagcatggtg aagtggttgc cgggcacgtc 
ccgccagtcg ccccgcgccc cgcccgcggg 
ggccagcagg acgggggctt cgagggcggt 
gccggccatg g 



ccctccggtg agcggggcgg gaccgggctg 10920 
cagggacgcg gtgtgccggg cgtgttcggt 10980 
ggcgacggtc cgtgcgaacg ggacctggga 11040 
cggccacgcg cacaggggtt cggacgcccg 11100 
gagccgggtt ccgagcacca gccgctgata 11160 

1117'' 



<210> 3 
~<21T> 711 
<212> ADN 

<213> Streptomyces annbof aciens 



<220> 

<221> CDS 

<222> (1) . . (711) 



<400> 3 

atg tac gcc gac gac ate gcg gec 
Met Tyr Ala Asp Asp lie Ala Ala 
1 5 

aag ggg aag gac tac egg cag gag 
Lys Gly Lys Asp Tyr Arg Gin Glu 
20 



gtc tac gac ctg gtc cac gag ggg 4 8 
Val Tyr Asp Leu Val His Glu Gly 
10 15 

gcc gag gag ate gcc gea etc gtg 96 
Ala Glu Glu lie Ala Ala Leu Val 
25 30 



cgc gtc cac egg ccg ggc gcc egg acc ctg etc gac gtg gcc tgc ggc 144 
Arg Val His Arg Pro Gly Ala Arg Thr Leu Leu Asp Val Ala Cvs Gly 
3 5 40 45 



ace ggc cag cac ctg cac cac ctg gac ggc etc ttc gac cac gtc gag 192 
Thr Gly Gin His Leu His His Leu Asp Gly Leu Phe Asp His Val Glu 
50 55 60 



ggc ctg gaa etc tec gcc gac atg ctg gcc etc gcg acc ggc egg aac 240 
Gly Leu Glu Leu Ser Ala Asp Met Leu Ala Leu Ala Thr Gly Arg Asn 
65 7 0 7 5 80 

ccc ggt gtc acc ttc cac caa ggg gac atg cgc teg ttc tec ctg gga 2 88 
Pro Gly Val Thr Phe His Gin Gly Asp Met Arg Ser Phe Ser Leu Gly 
85 90 95 

cgc egg ttc gac gcg gtg acc tgc atg ttc age tec ata ggc cac ctg 336 
Arg Arg Phe Asp Ala Val Thr Cys Met Phe Ser Ser lie Gly His Leu 
100 105 110 

egg acc acc gac gaa etc gac age acg ctg egg gcc ttc acc gac cac 3 84 
Arg Thr Thr Asp Glu Leu Asp Ser Thr Leu Arg Ala Phe Thr Asp His 
115 120 125 



etc gaa ccg tec ggc gtc ate gtc gtc gaa ccc tgg tgg ttc ccc gag 432 
Leu Glu Pro Ser Gly Val He Val Val Glu Pro Trp Trp Phe Pro Glu 
130 135 140 



tec ttc acc ccc ggt tac gtc ggc 
Ser Phe Thr Pro Gly Tyr Val Gly 
145 150 

cgc acc gtc tgc egg gtc teg cac 
Arg Thr Val Cys Arg Val Ser His 
165 



gcc age ate acg gag gcg ggc gag 480 
Ala Ser He Thr Glu Ala Glv Glu 
155 160 

tec gta egg gag ggg aac gcc acc 52 8 
Ser Val Arg Glu Gly Asn Ala Thr 
170 175 
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cgc ate gag gtg cac tac etc etc gec gga ccc ggc ggc gtc cgt cac 57 6 
Arg lie Glu Val His Tyr Leu Leu Ala Gly Pro Gly Gly Val Arg His 
180 185 190 

ctg acc gag gac cac acc ate acc etg ttc ccg cgc gec gac tac gag 624 
Leu Thr Glu Asp His Thr lie Thr Leu Phe Pro Arg Ala Asp Tyr Glu 
195 200 205 

gcg gec ttc gag cgc gec ggc tgc gac gtg gtc tac cag gaa ggc ggc . 672 
Ala Ala Phe Glu Arg Ala Gly Cys Asp Val Val Tyr Gin Glu Gly Gly 
210 215 220 

ccg tec ggt cgc ggg ctg ttc ate ggc acc cgc cgc tga 711 
Pro Ser Gly Arg Gly Leu Phe lie Gly Thr Arg Arg 
225 230 235 



<210> 4 
<211> 236 
<212> PRT 

<213> Streptomyces ambof aciens 

<400> 4 

Met Tyr Ala Asp Asp lie Ala Ala Val Tyr Asp Leu Val His Glu Gly 
15 10 15 

Lys Gly Lys Asp Tyr Arg Gin Glu Ala Glu Glu He Ala Ala Leu Val 
20 25 30 

Arg Val His Arg Pro Gly Ala Arg Thr Leu Leu Asp Val Ala Cys Gly 
35 40 45 

Thr Gly Gin His Leu His His Leu Asp Gly Leu Phe Asp His Val Glu 
50 55 60 

Gly Leu Glu Leu Ser Ala Asp Met Leu Ala Leu Ala Thr Gly Arg Asn 
65 70 75 80 

Pro Gly Val Thr Phe His Gin Gly Asp Met Arg Ser Phe Ser Leu Gly 
85 90 95 

Arg Arg Phe Asp Ala Val Thr Cys Met Phe Ser Ser He Gly His Leu 
100 105 110 

Arg Thr Thr Asp Glu Leu Asp Ser Thr Leu Arg Ala Phe Thr Asp His 
115 120 125 

Leu Glu Pro Ser Gly Val He Val Val Glu Pro Trp Trp Phe Pro Glu 
130 135 140 

Ser Phe Thr Pro Gly Tyr Val Gly Ala Ser He Thr Glu Ala Gly Glu 
145 150 155 160 

Arg Thr Val Cys Arg Val Ser His Ser Val Arg Glu Gly Asn Ala Thr 
165 170 175 

Arg He Glu Val His Tyr Leu Leu Ala Gly Pro Gly Gly Val Arg His 
180 185 190 

Leu Thr Glu Asp His Thr He Thr Leu Phe Pro Arg Ala Asp Tyr Glu 
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195 200 205 

Ala Ala Phe Glu Arg Ala Gly Cys Asp Val Val Tyr Gin Glu Gly Gly 

210 215 220 

Prn .^e^" Cll-xr a-y-z-r m y r T -rn _ , «vv 

_ , — j w-ujr 4_»<=u. it nc; xxt; \j±y mr arg 

225 230 235 



<210> 5 
<211> 1272 
<212> ADN 

<213> Streptomyces ambofaciens 

<220> 

<221> CDS 

<222> (1) . . (1272) 

<400> 5 

atg ccc acc ctt gec acg gaa acg gec ccc gcg age acg age acg age 48 

Met Pro Thr Leu Ala Thr Glu Thr Ala Pro Ala Ser Thr Ser Thr Ser 
1 5 10 15 

gcg gac acg age acg ggc gtc cgt gcg etc ggc cgt egg etc cag ctg 96 
Ala Asp Thr Ser Thr Gly Val Arg Ala Leu Gly Arg Arg Leu Gin Leu 
20 25 30 

acc egg gee gca cac tgg tgc gec ggc aac cag ggc gac ccg tac gcg 144 
Thr Arg Ala Ala His Trp Cys Ala Gly Asn Gin Gly Asp Pro Tyr Ala 
35 40 45 

ctg ate ctg cgc gec gtc gee gac ccc gag ccg ttc gaa egg gag ate 192 
Leu lie Leu Arg Ala Val Ala Asp Pro Glu Pro Phe Glu Arg Glu lie 
50 55 60 

egg gee cgc gga ccg tgg ttc cgc age gaa cag ctg gac gee tgg gtg 240 
Arg Ala Arg Gly Pro Trp Phe Arg Ser Glu Gin Leu Asp Ala Trp Val 
65 70 75 ~ 80 

acc gcg gac ccc gag gtg gcg gcg gec gtc ctg gee gac ccg cgc ttc 2 88 
Thr Ala Asp Pro Glu Val Ala Ala Ala Val Leu Ala Asp Pro Arg Phe 
85 90 95 

ggc acg ctg gac egg gee gga cgc egc ccg gac gag gaa ctg ctg ccc 336 
Gly Thr Leu Asp Arg Ala Gly Arg Arg Pro Asp Glu Glu Leu Leu Pro 
100 105 110 

etc gee gag gcg ttc ccc cac cac gaa cgc gcg gag etc gta cgc ctg 3 84 
Leu Ala Glu Ala Phe Pro His His Glu Arg Ala Glu Leu Val Arg Leu 
115 120 125 

egg gcg ctg gee gec ccg gtg etc age egg tac gee ccg gec cag gcg 432 
Arg Ala Leu Ala Ala Pro Val Leu Ser Arg Tyr Ala Pro Ala Gin Ala 
!30 135 140 

ccc tgc gcg gcg cgc acc acc gee cgc aga gtg etc ggc cgc ctg ctg 480 
Pro Cys Ala Ala Arg Thr Thr Ala Arg Arg Val Leu Gly Arg Leu Leu 
145 150 155 160 

ccc acc ggt gac gee ggg ttc gac ctt gtc ggc gag gtc gee egg ccc 528 
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Pro Thr Gly Asp Ala Gly Phe Asp Leu Val Gly Glu Val Ala Arg Pro 
165 170 175 

tac gcc gtc gag ctg atg etc agg etc etc gga gtg ccg ggc cgc gac 576 
Tyr Ala Val Glu Leu Met Leu Arg Leu Leu Gly Val Pro Gly Arg Asp 
180 185 190 

cgc gcc acc gcc gcg egg gca etc gcc gcc tgc ggc ccc cag etc gac 624 
Arg Ala Thr Ala Ala Arg Ala Leu Ala Ala Cys Gly Pro Gin Leu Asp 
135 200 205 

gcc egg atg gcc ccg caa ctg ctg acc gtg gcc egg gag tec gcc gac 672 
Ala Arg Met Ala Pro Gin Leu Leu Thr Val Ala Arg Glu Ser Ala Asp 
210 215 220 

gcc gtc cgc aca ctg gcc gac ctg gtc ccc gag etc gtc gcg gag aag 72 0 
Ala Val Arg Thr Leu Ala Asp Leu Val Pro Glu Leu Val Ala Glu Lys ■ 
225 230 235 240 

tec egg ggc etc ggg aac gcc gag ccc egg ccc gac gac gtg etc gcc 7 68 
Ser Arg Gly Leu Gly Asn Ala Glu Pro Arg Pro Asp Asp Val Leu Ala 
245 250 255 

etc etc ctg cac gac ggc gtc gcc ccc ggc gac gtc gag cgc ate gcg 816 
Leu Leu Leu His Asp Gly Val Ala Pro Gly Asp Val Glu Arg He Ala 
260 265 270 

ctg etc etc gcg gtc ggc gca ccc gaa ccc gtc gtc acc gcc gtc gcg 864 
Leu Leu Leu Ala Val Gly Ala Pro Glu Pro Val Val Thr Ala Val Ala 
27 $ 280 285 

cac acg gtc cac egg ctg etc ggc egg ccg ggg gag tgg gag agg gcc 912 
His Thr Val His Arg Leu Leu Gly Arg Pro Gly Glu Trp Glu Arg Ala 

295 300 

cgc egg acg ccg gcc gcg gcg aac gcc gtc gac cag gtg ctg cgc gag 960 
Arg Arg Thr Pro Ala Ala Ala Asn Ala Val Asp Gin Val Leu Arg Glu 
305 310 315 320 

cgc ccc ccg gcc egg ctg gag aac egg gtc gcg cac acc ggc etc gaa 1008 
Arg Pro Pro Ala Arg Leu Glu Asn Arg Val Ala His Thr Gly Leu Glu 
32 $ 330 335 

etc ggc ggc cgc egg ate acc gcc gac gag cac gtc gtg gtg ctg gcc 1056 
Leu Gly Gly Arg Arg He Thr Ala Asp Glu His Val Val Val Leu Ala 
34 ° 345 350 

gcc gcc gga egg gag ate ccc ggg ccg gag ccg etc ggg ggc gcc gac 1104 
Ala Ala Gly Arg Glu He Pro Gly Pro Glu Pro Leu Gly Gly Ala Asp 
355 360 365 

gga ccg cac ctg gcg etc gcc etc ccg ctg ate cgc ctg gcc gcc acc 1152 
Gly Pro His Leu Ala Leu Ala Leu Pro Leu He Arg Leu Ala Ala Thr 
370 375 380 

acc gcg gtc cag gtc acg gcc ggc cgc ctg ccc ggc ctg egg gcc gag 12 0 0 
Thr Ala Val Gin Val Thr Ala Gly Arg Leu Pro Gly Leu Arg Ala Glu 
385 390 395 400 

gga ccg ccc ctg acc egg ccg egg tea ccg gtc ctg ggc gcc tgc gcc -3 248 
Gly Pro Pro Leu Thr Arg Pro Arg Ser Pro Val Leu Gly Ala Cys Ala 
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405 



410 



415 



cgc etc egg gtc cac ccg gga tga 
Arg Leu Arg Val His Pro Gly 
420 



1272 



<210> 6 

~<-2-l-l->— 42-3 — 

<212> PRT 

<213> Streptomyces ambofaciens 
<400> 6 

Met Pro Thr Leu Ala Thr Glu Thr Ala Pro Ala Ser Thr Ser Thr Ser 
15 10 15 

Ala Asp Thr Ser Thr Gly Val Arg Ala Leu Gly Arg Arg Leu Gin Leu 
20 25 30 

Thr Arg Ala Ala His Trp Cys Ala Gly Asn Gin Gly Asp Pro Tyr Ala 
35 40 45 

Leu He Leu Arg Ala Val Ala Asp Pro Glu Pro Phe Glu Arg Glu He 
50 55 60 

Arg Ala Arg Gly Pro Trp Phe Arg Ser Glu Gin Leu Asp Ala Trp Val 
65 70 75 80 

Thr Ala Asp Pro Glu Val Ala Ala Ala Val Leu Ala Asp Pro Arg Phe 
85 90 95 

Gly Thr Leu Asp Arg Ala Gly Arg Arg Pro Asp Glu Glu Leu Leu Pro 
100 105 110 

Leu Ala Glu Ala Phe Pro His His Glu Arg Ala Glu Leu Val Arg Leu 
115 120 125 

Arg Ala Leu Ala Ala Pro Val Leu Ser Arg Tyr Ala Pro Ala Gin Ala 
130 135 140 

Pro Cys Ala Ala Arg Thr Thr Ala Arg Arg Val Leu Gly Arg Leu Leu 
145 150 155 160 

Pro Thr Gly Asp Ala Gly Phe Asp Leu Val Gly Glu Val Ala Arg Pro 
165 170 175 

Tyr Ala Val Glu Leu Met Leu Arg Leu Leu Gly Val Pro Gly Arg Asp 
180 185 190 

Arg Ala Thr Ala Ala Arg Ala Leu Ala Ala Cys Gly Pro Gin Leu Asp 
195 200 205 

Ala Arg Met Ala Pro Gin Leu Leu Thr Val Ala Arg Glu Ser Ala Asp 
210 215 220 

Ala Val Arg Thr Leu Ala Asp Leu Val Pro Glu Leu Val Ala Glu Lys 
225 230 235 240 

Ser Arg Gly Leu Gly Asn Ala Glu Pro Arg Pro Asp Asp Val Leu Ala 



245 



250 



255 
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Leu Leu Leu His Asp Gly Val Ala Pro Gly Asp Val Glu Arg lie Ala 
260 265 270 

Leu Leu Leu Ala Val Gly Ala Pro Glu Pro Val Val Thr Ala Val Ala 
275 280 285 

His Thr Val His Arg Leu Leu Gly Arg Pro Gly Glu Trp Glu Arg Ala 
290 295 300 

Arg Arg Thr Pro Ala Ala Ala Asn Ala Val Asp Gin Val Leu Arg Glu 
305 310 315 320 

Arg Pro Pro Ala Arg Leu Glu Asn Arg Val Ala His Thr Gly Leu Glu 
325 330 335 

Leu Gly Gly Arg Arg lie Thr Ala Asp Glu His Val Val Val Leu Ala 
340 345 350 

Ala Ala Gly Arg Glu lie Pro Gly Pro Glu Pro Leu Gly Gly Ala Asp 
355 360 365 

Gly Pro His Leu Ala Leu Ala Leu Pro Leu lie Arg Leu Ala Ala Thr 
370 375 380 

Thr Ala Val Gin Val Thr Ala Gly Arg Leu Pro Gly Leu Arg Ala Glu 
385 390 395 400 

Gly Pro Pro Leu Thr Arg Pro Arg Ser Pro Val Leu Gly Ala Cys Ala 
405 410 415 

Arg Leu Arg Val His Pro Gly 
420 



<210> 7 
<211> 1266 
<212> ADN 

<213> Streptomyces ambofaciens 

<220> 

<221> CDS 

<222> (1) . . (1266) 



<400> 7 

gtg cgc gtc ctg ctg aca tec etc gec cac aac acc cac tac tac agt 48 

Val Arg Val Leu Leu Thr Ser Leu Ala His Asn Thr His Tyr Tyr Ser 

1 5 10 15 

ctg gtg ccc etc gec tgg gcg ctg cgc gec gec ggg cac gag gta egg 9 6 
Leu Val Pro Leu Ala Trp Ala Leu Arg Ala Ala Gly His Glu Val Arg 
20 25 30 

gtg gcg age ccg ccc tec etc acc gac gtc ate acc tec acc ggc ctg 144 
Val Ala Ser Pro Pro Ser Leu Thr Asp Val He Thr Ser Thr Gly Leu 
35 40 45 

acc gee gta ccg gtg ggc gac gac cga ccg gee gcg gag ctg etc gec 192 
Thr Ala Val Pro Val Gly Asp Asp Arg Pro Ala Ala Glu Leu Leu Ala 
50 55 60 
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gag atg ggc age gac etc gtc ccc tac cag egg ggc ttc gag ttc ggt 240 
Glu Met Gly Ser Asp Leu Val Pro Tyr Gin Arg Gly Phe Glu Phe Gly 
65 70 75 80 

gag gtg gag age gag gag gag ace ace tgg gag tac ctg etc ggc cag 2 88 
Glu Val Glu Ser Glu Glu Glu Thr Thr Trp Glu Tyr Leu Leu Gly Gin 
85 90 95 

cag age atg~atg geef gee ctg "tgc ttc gec ccg "ttc "aac ggc'gcc ^gec """ '336' 
Gin Ser Met Met Ala Ala Leu Cys Phe Ala Pro Phe Asn Gly Ala Ala 
100 105 110 

acg atg gac gag ate gtc gac ttc gec cgt ggc tgg egg ccc gac ctg 3 84 
Thr Met Asp Glu lie Val Asp Phe Ala Arg Gly Trp Arg Pro Asp Leu 
115 120 125 

gtc gtg tgg gaa ccc tgg acc tac gcg ggg ccg gtc gcg gec cgc gec 432 
Val Val Trp Glu Pro Trp Thr Tyr Ala Gly Pro Val Ala Ala Arg Ala 
130 135 140 

tgc ggt gec gee cae gcg cgc ate ctg tgg ggc ccc gac gec ate gga 4 80 
Cys Gly Ala Ala His Ala Arg He Leu Trp Gly Pro Asp Ala He Gly 
145 150 155 160 

cgc tec cgc ctg cgc ttc etc gec gec etc gac ggg atg ccg gag gaa 52 8 
Arg Ser Arg Leu Arg Phe Leu Ala Ala Leu Asp Gly Met Pro Glu Glu 
165 170 175 

ctg cgc gag gac ccc ate gec gaa tgg etc ggc tgg acg ctg gac egg 57 6 
Leu Arg Glu Asp Pro lie Ala Glu Trp Leu Gly Trp Thr Leu Asp Arg 
180 185 190 

tac ggg etc gec ttc gac gaa cgc gac gtg etc ggc cac tgg gtg ate 624 
Tyr Gly Leu Ala Phe Asp Glu Arg Asp Val Leu Gly His Trp Val He 
195 200 205 

gac ccg ggc ccg cgc age acc cgc etc gac ctg ggc cag acc acg gtg 672 
Asp Pro Gly Pro Arg Ser Thr Arg Leu Asp Leu Gly Gin Thr Thr Val 
210 215 220 

ccc atg tgc tac gtg ccc tac aac ggg cgc tec gtg ate gaa ccc tgg 720 
Pro Met Cys Tyr Val Pro Tyr Asn Gly Arg Ser Val He Glu Pro Trp 
225 230 235 240 

etc ggc aag aag ccc gac cgc ccc cgc gtc tgc etc acc etc ggc gtg 768 
Leu Gly Lys Lys Pro Asp Arg Pro Arg Val Cys Leu Thr Leu Gly Val 
245 250 255 

tec gec cgc gag acc tac ggc cgc gac gcg gtc tec tac tec gaa ctg 816 
Ser Ala Arg Glu Thr Tyr Gly Arg Asp Ala Val Ser Tyr Ser Glu Leu 
260 265 270 

ctg gag gcg etc ggc egg ctg gac ate gag gtg gtg gec acc ctg gac 864 
Leu Glu Ala Leu Gly Arg Leu Asp He Glu Val Val Ala Thr Leu Asp 
275 280 285 

acc tec cag etc gac cgc ctg ggc acc etc ccc gac aac gtc gtg ccc 912 
Thr Ser Gin Leu Asp Arg Leu Gly Thr Leu Pro Asp Asn Val Val Pro 
290 295 300 



gtg gac ttc gta ccg etc gac gcg ctg ctg ccg age tgc gee gcg ate 



960 
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Val Asp Phe Val Pro Leu Asp Ala Leu Leu Pro Ser Cys Ala Ala lie 
305 310 315 320 

ate cac cac ggc gga gcg ggc acc tgg tec ace gee ctg cgc cac gga 1008 
He His His Gly Gly Ala Gly Thr Trp Ser Thr Ala Leu Arg His Gly 
325 330 335 

gtg ccg cag ate ctg ctg ccc tec ctg tgg gac gcg ccg etc aag gcg 1056 
Val Pro Gin He Leu Leu Pro Ser Leu Trp Asp Ala Pro Leu Lys Ala 
340 345 350 

cag caa etc cag cgc ctg tec gec ggg ttc gac ctg ccc gcg gcg acg 1104 
Gin Gin Leu Gin Arg Leu Ser Ala Gly Phe Asp Leu Pro Ala Ala Thr 
355 360 365 

etc acg gcg cgc ggt ctg gee gac gcg gtg cac acg gec gtg cac gac 1152 
Leu Thr Ala Arg Gly Leu Ala Asp Ala Val His Thr Ala Val His Asp 
370 375 380 

ccc gcg ate agg gcg ggc gcg egg egg ctg age gag gag atg etc gec 1200 
Pro Ala He Arg Ala Gly Ala Arg Arg Leu Ser Glu Glu Met Leu Ala 
385 390 395 400 

gac ccc acg ccc gee ggg ate ate ccc acc ctg gag cgc etc acc gee 12 48 
Asp Pro Thr Pro Ala Gly He He Pro Thr Leu Glu Arg Leu Thr Ala 
405 410 415 

ctg cac egg gec acc tga 12 66 

Leu His Arg Ala Thr 
420 



<210> 8 
<211> 421 
<212> PRT 

<213> Streptomyces ambofaciens 
<400> 8 

Val Arg Val Leu Leu Thr Ser Leu Ala His Asn Thr His Tyr Tyr Ser 
1.5 10 15 

Leu Val Pro Leu Ala Trp Ala Leu Arg Ala Ala Gly His Glu Val Arg 
. 20 25 30 

Val Ala Ser Pro Pro Ser Leu Thr Asp Val He Thr Ser Thr Gly Leu 
3 5 40 45 

Thr Ala Val Pro Val Gly Asp Asp Arg Pro Ala Ala Glu Leu Leu Ala 
50 55 60 

Glu Met Gly Ser Asp Leu Val Pro Tyr Gin Arg Gly Phe Glu Phe Gly 
65 70 75 80 

Glu Val Glu Ser Glu Glu Glu Thr Thr Trp Glu Tyr Leu Leu Gly Gin 
85 90 95 

Gin Ser Met Met Ala Ala Leu Cys Phe Ala Pro Phe Asn Gly Ala Ala 
100 105 110 

Thr Met Asp Glu He Val Asp Phe Ala Arg Gly Trp Arg Pro Asp Leu 
115 120 125 
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Val Val Trp Glu Pro Trp Thr Tyr Ala Gly Pro Val Ala Ala Arg Ala 
130 13 5 140 

Cys Gly Ala Ala His Ala Arg He Leu Trp Gly Pro Asp Ala He Gly 
145 150 155 ~ 160 

Arg Ser Arg Leu Arg Phe Leu Ala Ala Leu Asp Gly Met Pro Glu Glu 
165 170 175 



Leu Arg Glu Asp Pro -He Ala Glu Trp Leu Gly Trp Thr Leu Asp Arg 
180 185 190 

Tyr Gly Leu Ala Phe Asp Glu Arg Asp Val Leu Gly His Trp Val He 
195 200 205 

Asp Pro Gly Pro Arg Ser Thr Arg Leu Asp Leu Gly Gin Thr Thr Val 
210 215 220 

Pro Met Cys Tyr Val Pro Tyr Asn Gly Arg Ser Val He Glu Pro Trp 
225 230 235 240 

Leu Gly Lys Lys Pro Asp Arg Pro Arg Val Cys Leu Thr Leu Gly Val 
245 250 255 

Ser Ala Arg Glu Thr Tyr Gly Arg Asp Ala Val Ser Tyr Ser Glu Leu 
260 265 270 

Leu Glu Ala Leu Gly Arg Leu Asp He Glu Val Val Ala Thr Leu Asp 
275 280 285 

Thr Ser Gin Leu Asp Arg Leu Gly Thr Leu Pro Asp Asn Val Val Pro 
290 295 300 

Val Asp Phe Val Pro Leu Asp Ala Leu Leu Pro Ser Cys Ala Ala He 
305 310 315 320 

He His His Gly Gly Ala Gly Thr Trp Ser Thr Ala Leu Arg His Gly 
325 330 335 

Val Pro Gin He Leu Leu Pro Ser Leu Trp Asp Ala Pro Leu Lys Ala 
340 345 350 

Gin Gin Leu Gin Arg Leu Ser Ala Gly Phe Asp Leu Pro Ala Ala Thr 
355 360 365 

Leu Thr Ala Arg Gly Leu Ala Asp Ala Val His Thr Ala Val His Asp 
370 375 380 

Pro Ala He Arg Ala Gly Ala Arg Arg Leu Ser Glu Glu Met Leu Ma 
385 390 395 400 

Asp Pro Thr Pro Ala Gly He He Pro Thr Leu Glu Arg Leu Thr Ala 
405 410 415 

Leu His Arg Ala Thr 
420 



<210> 9 
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<211> 1350 
<212> ADN 

<213> Streptomyces ambofaciens 



<220> 
<221> CDS 
<222> (1) . 



(1350) 



<400> 9 

atg ccc gaa age cat gcg cag age gcg ctg etc gec gcg ate acc gec 

Met Pro Glu Ser His Ala Gin Ser Ala Leu Leu Ala Ala lie Thr Ala 
15 10 15 



48 



gcg gac cgc acc ccc gag gac ate gcg gcg ctg ccc ctg ccc gag tec 
Ala Asp Arg Thr Pro Glu Asp lie Ala Ala Leu Pro Leu Pro Glu Ser 
20 25 30 



96 



ttc cgc gec gtg acc gtc cgc aaa gag gac acc gac atg ttc cgc ggg 
Phe Arg Ala Val Thr Val Arg Lys Glu Asp Thr Asp Met Phe Arg Gly 
35 40 45 



144 



atg ccg age gcg gac aag gac ccg cgc aag tec ctg cac gtc gac gag 
Met Pro Ser Ala Asp Lys Asp Pro Arg Lys Ser Leu His Val Asp Glu 
50 55 60 



192 



gtg ccg ctg ccc gaa gtg ggg ccc ggg gag gcg ctg gtc gcg gtg atg 
Val Pro Leu Pro Glu Val Gly Pro Gly Glu Ala Leu Val Ala Val Met 
65 70 75 80 



240 



gee age tec gtc aac tac aac acg gtc tgg tec tec ate ttc gag ccc 
Ala Ser Ser Val Asn Tyr Asn Thr Val Trp Ser Ser lie Phe Glu Pro 
85 90 95 



288 



etc ccg acg ttc ggc ttc ctg gag cgc tac ggg cgc acc teg ccg ctg 
Leu Pro Thr Phe Gly Phe Leu Glu Arg Tyr Gly Arg Thr Ser Pro Leu 
100 105 110 



336 



gee gcg cgc cac gac ctg ccg tac cac ate etc ggt tec gac ctg tec 
Ala Ala Arg His Asp Leu Pro Tyr His lie Leu Gly Ser Asp Leu Ser 
115 120 125 



384 



ggc gtg gtg ctg cgc acg gga ccc ggc gtg aac gtc tgg aaa ccc ggt 
Gly Val Val Leu Arg Thr Gly Pro Gly Val Asn Val Trp Lys Pro Gly 
130 135 140 



432 



gac gag gtc gtc gcg cac tgt ctg teg gtg gag ctg gag age ccc gac 
Asp Glu Val Val Ala His Cys Leu Ser Val Glu Leu Glu Ser Pro Asp 
145 150 155 160 



480 



ggg cac gac gac acc atg etc gac ccg gec cag cgc ate tgg ggc ttc 
Gly His Asp Asp Thr Met Leu Asp Pro Ala Gin Arg lie Trp Gly Phe 
165 170 175 



528 



gag acc aac ttc ggg ggc ctg gec gag gtg gee etc gtc aag tec aac 
Glu Thr Asn Phe Gly Gly Leu Ala Glu Val Ala Leu Val Lys Ser Asn 
180 185 190 



576 



cag ctg atg ccc aag gcg gee cat ctg acc tgg gag gag gec gec gcg 
Gin Leu Met Pro Lys Ala Ala His Leu Thr Trp Glu Glu Ala Ala Ala 
195 200 205 



624 
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Pro rfl r r° tCC aC ° S ° C taC Cgc cag ctg gtc tcc c ^ c aac 672 

Pro Gly Leu Val Asn Ser Thr Ala Tyr Arg Gin Leu Val Ser Arg Asn 
210 215 220 

H?° f. tg aag Cag ggc gac aac ^tg ct ST a tc tgg ggc gec age 720 
«*a v^y iv jeL ^ uxn Gly Asp Asn Val Leu Ile 

225 230 235 240 

" ait tit t2 ggc ^ cg ^c-gee acc cag ctggcc etc gec ggc ggg gee 768 
Gly Gly Leu Gly Ser Tyr Ala Thr Gin Leu Ala Leu Ala Gly Gly Ala 
'245 ■ - 250 - '255 

cac ccc gtc tgc gtg gtc tcc age gcg cgc aag gec gag gtg tgc egg 816 
HlS Pro Val C ^ s Va l Val Ser Ser Ala Arg Lys Ala Glu Val Cys Arg 
260 265 270 

5 fc ? o?° g f g gCC atC at ° gac cgc tcc ^ cc sac tac cgc 864 

Ala Met Gly Ala Glu Ala He lie Asp Arg Ser Ala Glu Asp Tyr Arg 

275 280 285 

.ttc tgg age gac gag gac acc cag gac ccg egg gag tgg aag cgc ttc 912 
Phe Trp Ser Asp Glu Asp Thr Gin Asp Pro Arg Slu Trp Lys 2g Pne 
290 295 300 

ggc aag cgc ate cgc gag gtc acc ggg ggc gag gac gtc gac ate gtc 960 
Gly Lys Arg Ile Arg Glu Val Thr Gly Gly Glu Asp Val Asp Ile Val 

JJ - U 315 320 

oi C ^f 9 S a ° ° CC 9gC ° gg gag acc ttc ggg gc 9 tcc gtc tac gtc acc 1008 
Phe Glu His Pro Gly Arg Glu Thr Phe Gly Ala Ser Val Tyr Val Thr 
325 330 335 

cgc agg ggc ggc acg ate gtc acc tgc gee tcc acc teg ggc ttc cgc 105 6 
Arg Arg Gly Gly Thr lie Val Thr Cys Ala Ser Thr Ser Sy PhS Arg 
340 345 350 

His Su lit ?™ T C ^ C ^ C CtC tgg atg CHC CtC aag Cgt atc 3tc 1104 
Hrs Glu Phe Asp Asn Arg Tyr Leu Trp Met His Leu Lys Arg Ile Val 

355 360 365 

ItZ Th^ I? ^ C aaC taC ° gC gag gCg tgg gag gcg aac ^ ^c 

Gly Thr Hxs Phe Ala Asn Tyr Arg Glu Ala Trp Glu Ala Asn Arg Leu 

370 375 380 



1152 



1200 



1248 



Si ° f 39 o? 9 399 atC CaC CCC acc ctc fccg cgc acc tac ccg ctg 
Val Ala Lys Gly Arg He His Pro Thr Leu Ser Arg Thr Tyr Pro Leu 

385 390 395 " 400 

?i ° ^ g ? g gtt gCC gtg Cac gac 3tg cac ggc aac cag cac cag 

Ala Asp Thr Ala Val Ala Val His Asp Val His Gly Asn Gin His Gin 
405 410 415 

111 lJ? rf ,f? f tC Ctg gCg CCC aCg gag ggg ctg ggc gtg 1296 

Gly Lys Val Gly Val Leu Cys Leu Ala Pro Thr Glu Gly Leu Gly Val 

420 425 4 30 

Sg So mn CU, t" ^ ^ ^ ^ 33C 9CQ &tC a&C Cgg ttC 1344 

Arg Asp Glu Glu Lys Arg Ala Arg His Ile Asp Ala lie Asn Arg Phe 

435 440 445 



cgc tga 



1350 
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Arg 

450 



<210> 10 
<211> 449 
<212> PRT 

<213> Streptomyces ambofaciens 
<400> 10 

Met Pro Glu Ser His Ala Gin Ser Ala Leu Leu Ala Ala lie Thr Ala 
15 10 15 

Ala Asp Arg Thr Pro Glu Asp lie Ala Ala Leu Pro Leu Pro Glu Ser 
20 25 30 

Phe Arg Ala Val Thr Val Arg Lys Glu Asp Thr Asp Met Phe Arg Gly 
35 40 45 

Met Pro Ser Ala Asp Lys Asp Pro Arg Lys Ser Leu His Val Asp Glu 
50 55 60 

Val Pro Leu Pro Glu Val Gly Pro Gly Glu Ala Leu Val Ala Val Met 
65 70 75 80 

Ala Ser Ser Val Asn Tyr Asn Thr Val Trp Ser Ser lie Phe Glu Pro 
85 90 95 

Leu Pro Thr Phe Gly Phe Leu Glu Arg Tyr Gly Arg Thr Ser Pro Leu 
100 105 110 

Ala Ala Arg His Asp Leu Pro Tyr His lie Leu Gly Ser Asp Leu Ser 
115 120 125 

Gly Val Val Leu Arg Thr Gly Pro Gly Val Asn Val Trp Lys Pro Gly 
130 135 140 

Asp Glu Val Val Ala His Cys Leu Ser Val Glu Leu Glu Ser Pro Asp 
145 150 155 160 

Gly His Asp Asp Thr Met Leu Asp Pro Ala Gin Arg lie Trp Gly Phe 
165 170 175 

Glu Thr Asn Phe Gly Gly Leu Ala Glu Val Ala Leu Val Lys Ser Asn 
180 185 190 

Gin Leu Met Pro Lys Ala Ala His Leu Thr Trp Glu Glu Ala Ala Ala 
195 200 205 

Pro Gly Leu Val Asn Ser Thr Ala Tyr Arg Gin Leu Val Ser Arg Asn 
210 215 220 

Gly Ala Gly Met Lys Gin Gly Asp Asn Val Leu lie Trp Gly Ala Ser 
225 230 235 240 

Gly Gly Leu Gly Ser Tyr Ala Thr Gin Leu Ala Leu Ala Gly Gly Ala 
245 250 255 



His Pro Val Cys Val Val Ser Ser Ala Arg Lys Ala Glu Val Cys Arg 
260 265 270 
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Ala Met Gly Ala Glu Ala lie lie Asp Arg Ser Ala Glu Asp Tyr Arg 
275 280 285 

Phe Trp Ser Asp Glu Asp Thr Gin Asp Pro Arg Glu Trp Lys Arg Phe 
290 < 295 300 

Gly Lys Arg He Arg Glu Val Thr Gly Gly Glu Asp Val Asp He Val 
305 310 315 320 

Phe Glu His Pro Gly Arg Glu Thr Phe Gly Ala Ser Val Tyr Val Thr 
325 . . . 330 335 

Arg Arg Gly Gly Thr He Val Thr Cys Ala Ser Thr Ser Glv Phe Arg 
340 345 350 

His Glu Phe Asp Asn Arg Tyr Leu Trp Met His Leu Lys Arg He Val 
355 360 365 

Gly Thr His Phe Ala Asn Tyr Arg Glu Ala Trp Glu Ala Asn Arg Leu 
370 375 380 

Val Ala Lys Gly Arg He His Pro Thr Leu Ser Arg Thr Tyr Pro Leu 
385 3 ^0 395 ~ 400 

Ala Asp Thr Ala Val Ala Val His Asp Val His Gly Asn Gin His Gin 
405 410 415 

Gly Lys Val Gly Val Leu Cys Leu Ala Pro Thr Glu Gly Leu Gly Val 
420 425 430 

Arg Asp Glu Glu Lys Arg Ala Arg His He Asp Ala He Asn Arg Phe 
435 440 445 

Arg 



<210> 11 
<211> 675 
<212> ADN 

<213> Streptomyces ambofaciens 

<220> 

<221> CDS 

<222> (1) . . (675) 

<400> 11 

atg atg age gtg gca gac cag acg get 
Met Met Ser Val Ala Asp Gin Thr Ala 
1 5 

tac gec egg age gtc gcg ctg egg gac 
Tyr Ala Arg Ser Val Ala Leu Arg Asp 
20 25 

cac gag gtg acc gec ggg etc ccc ggc 
His Glu Val Thr Ala Gly Leu Pro Gly 
3 5 40 

ccc gag gag gcg cag ttc etc gec ctg 
Pro Glu Glu Ala Gin Phe Leu Ala Leu 



etc age ccc gcg ctg ctg gag 4 8 
Leu Ser Pro Ala Leu Leu Glu 
10 15 

gac ggc ctg ctg cgc gaa ctg 96 
Asp Gly Leu Leu Arg Glu Leu 
30 

ggc egg gec atg cag ate atg 144 
Gly Arg Ala Met Gin He Met 
45 

ctg ate egg etc gtc ggt gec 192 
Leu He Arg Leu Val Gly Ala 
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50 55 60 

egg egg gtg ctg gag ate ggc ace ttc acg ggg tac age acg ctg tgc 240 

Arg Arg Val Leu Glu lie Gly Thr Phe Thr Gly Tyr Ser Thr Leu Cys 

65 70 75 80 

atg gcg egg gca ctg ccc gee gac ggc ace gtc gtc ace tgc gac ate 2 88 

Met Ala Arg Ala Leu Pro Ala Asp Gly Thr Val Val Thr Cys Asp lie 

85 90 95 

age gac agg tgg ccc ggc gtc ggc gca ccg tac tgg cgc egg gec ggg 33 6 

Ser Asp Arg Trp Pro Gly Val Gly Ala Pro Tyr Trp Arg Arg Ala Gly 

100 105 110 

gtg gag tec egg ate gac ctg cgc gtc ggc gac gec gtc egg ace etc 3 84 

Val Glu Ser Arg lie Asp Leu Arg Val- Gly Asp Ala Val Arg Thr Leu 

115 120 125 

gee gag etc cgc gag cac gag ggg gac ggc teg ttc gac ctg gtc ttc 432 

Ala Glu Leu Arg Glu His Glu Gly Asp Gly Ser Phe Asp Leu Val Phe 

130 135 140 

gtc gac gec gac aag ace ggg tac ccg cac tac tac gag cag gcg ctg 48 0 

Val Asp Ala Asp Lys Thr Gly Tyr Pro His Tyr Tyr Glu Gin Ala Leu 

145 150 155 160 

gee ctg gta cgc ccc ggc gga ctg gtg gcg gtc gac aac acc ctg ttc 52 8 

Ala Leu Val Arg Pro Gly Gly Leu Val Ala Val Asp Asn Thr Leu Phe 

165 170 175 

ttc ggc egg gtg gec gac ccg gee gtc gag gac gee gac acc gtc gee 57 6 

Phe Gly Arg Val Ala Asp Pro Ala Val Glu Asp Ala Asp Thr Val Ala 

180 - 185 190 

gtg cgc gcg etc aac gag ctg ctg cgc gac gac gaa cgc gtg gac ate 62 4 

Val Arg Ala Leu Asn Glu Leu Leu Arg Asp Asp Glu Arg Val Asp lie 

195 200 205 

gee ctg ctg acg gtc gee gac ggg ate act ctg gee cgc egg egg gag 67 2 

Ala Leu Leu Thr Val Ala Asp Gly He Thr Leu Ala Arg Arg Arg Glu 

210 215 220 

tga 675 

225 



<210> 12 
<211> 224 
<212> PRT 

<213> Streptomyces ambofaciens 
<400> 12 

Met Met Ser Val Ala Asp Gin Thr Ala Leu Ser Pro Ala Leu Leu Glu 
15 10 15 

Tyr Ala A.rg Ser Val A.la Leu Arg Asp Asp Gly Leu Leu Arg Glu Leu 
20 25 30 

His Glu Val Thr Ala Gly Leu Pro Gly Gly Arg Ala Met Gin He Met 
35 40 45 
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Pro Glu Glu Ala Gin Phe Leu Ala Leu Leu He Arg Leu Val Gly Ala 
50 55 60 

Arg Arg Val Leu Glu He Gly Thr Phe Thr Gly Tyr Ser Thr Leu Cys 
65 70 75 80 

Met Ala Arg Ala Leu Pro Ala Asp Gly Thr Val Val Thr Cys Asp He 

- - - - 85- - 9 0 95 - 

Ser Asp Arg Trp Pro Gly Val Gly Ala Pro Tyr Trp Arg Arg Ala Gly 
100 105 110 

Val Glu Ser Arg He Asp Leu Arg Val Gly Asp Ala Val Arg Thr Leu 
115 120 125 

Ala Glu Leu Arg Glu His Glu Gly Asp Gly Ser Phe Asp Leu Val Phe 
130 135 140 

Val Asp Ala Asp Lys Thr Gly Tyr Pro His Tyr Tyr Glu Gin Ala Leu 
145 150 155 160 

Ala Leu Val Arg Pro Gly Gly Leu Val Ala Val Asp Asn Thr Leu Phe 
165 170 175 

Phe Gly Arg Val Ala Asp Pro Ala Val Glu Asp Ala Asp Thr Val Ala 
180 185 190 

Val Arg Ala Leu Asn Glu Leu Leu Arg Asp Asp Glu Arg Val Asp He 
195 200 205 

Ala Leu Leu Thr Val Ala Asp Gly He Thr Leu Ala Arg Arg Arg Glu 
210 215 220 



<210> 13 
<211> 1245 
<212> ADN 

<213> Streptomyces ambofaciens 

<220> 

<221> CDS 

<222> (1) . . (1245) 

<400> 13 

gtg etc cag cgc gtc gat ctg teg tea etc acc ggc etc cgc tgg tat 4 8 

Val Leu Gin Arg Val Asp Leu Ser Ser Leu Thr Gly Leu Arg Trp Tyr 

15 10 15 

gcg gcg ctg acg gta ttc gec tgt cac ate gec cag cag ggc ttc ttc 9 6 
Ala Ala Leu Thr Val Phe Ala Cys His He Ala Gin Gin Gly Phe Phe 
20 25 30 

gec gac cag cag gtg ggc age gca ctg ctg cac ate acc ccg etc ggt 144 
Ala Asp Gin Gin Val Gly Ser Ala Leu Leu His. He Thr Pro Leu Gly 
35 40 45 

tec atg gcg gtc teg ate ttc ttc ata ctg agt gga ttc gtc etc gec 192 
Ser Met Ala Val Ser He Phe Phe He Leu Ser Gly Phe Val Leu Ala 
50 55 60 
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tgg teg gec cgc gac gag gac tec gtg ccg act ttc tgg egg cgc cgc 240 
Trp Ser Ala Arg Asp Glu Asp Ser Val Pro Thr Phe Trp Arg Arg Arg 



65 70 



75 80 



288 



ate gcg aag ate tat ccg ctg cat etc gcg acg ttc ggc ate gcg get 
lie Ala Lys lie Tyr Pro Leu His Leu Ala Thr Phe Gly He Ala Ala 
85 90 95 

etc ate att ttc tec ctg teg gag ccg gta ctt ccc ggc ggt tec gta 33 6 
Leu He He Phe Ser Leu Ser Glu Pro Val Leu Pro Gly Gly Ser Val 
100 105 110 

tgg gac ggg ctg gtg ccc aat gtt ctg etc gtg cag tec tgg ctt ccc 3 84 
Trp Asp Gly Leu Val Pro Asn Val Leu Leu Val Gin Ser Trp Leu Pro 
115 120 125 

gac gcg ace etc acg gee agt' ttc aac acg ccc age tgg teg etc tec 432 
Asp Ala Thr Leu Thr Ala Ser Phe Asn Thr Pro Ser Trp Ser Leu Ser * 
130 135 140 

tgt gag ate gee ttc tat ctg teg ttc ccg ctg tgg tac egg ctg gtg 480 
Cys Glu He Ala Phe Tyr Leu Ser Phe Pro Leu Trp Tyr Arg Leu Val 
145 150 155 160 

cgc agg att ccc gca egg egg ctg tgg tgg tgc gee gcg ggg ate gee 52 8 
Arg Arg He Pro Ala Arg Arg Leu Trp Trp Cys Ala Ala Gly He Ala 
165 170 175 

gtg gec gtg acg tgt gtg ccc ctg ctg gcg ggc ctg etc ccg gcg age 576 
Val Ala val* Thr Cys Val Pro Leu Leu Ala Gly Leu Leu Pro Ala Ser 
180 185 190 

gag gag gtg gec ccc ggg atg teg etc aac gag gtc tgg ttc gcg tac 624 
Glu Glu Val Ala Pro Gly Met Ser Leu Asn Glu Val Trp Phe Ala Tyr 
195 200 205 

tgg ctt ccg ccg gtg cgc atg ctg gag ttc gtc etc ggc ate gtg atg 672 
Trp Leu Pro Pro Val Arg Met Leu Glu Phe Val Leu Gly He Val Met 
210 215 220 

gcg ctg ate ctg cgc gcg ggg ate tgg aag ggc ccc ggt ccg crcg gtc 72 0 
Ala Leu He Leu Arg Ala Gly He Trp Lys Gly Pro Gly Pro Ala Val 
225 230 235 240 

tgc acg gcg etc etc gee gcg agt tac ggc etc ace cag atg gtg ccc 768 
Cys Thr Ala Leu Leu Ala Ala Ser Tyr Gly Leu Thr Gin Met Val Pro 
245 250 255 

ccg ate ttc ace etc gtc gec tgc tec gtc gta ccg gec gcg ctg ctg 816 
Pro He Phe Thr Leu Val Ala Cys Ser Val Val Pro Ala Ala Leu Leu 
260 265 270 

ate acg gcg ctg gee gac gee gac gtg cac ggc egg cgc acg ggg ctg 864 
He Thr Ala Leu Ala Asp Ala Asp Val His Gly Arg Arg Thr Gly Leu 
275 280 285 

cgt teg gcg acg ctg gtg egg ctg ggc cag tgg tec ttc gee ttc tac 912 
Arg Ser Ala Thr Leu Val Arg Leu Gly Gin Trp Ser Phe Ala Phe Tyr 
290 295 300 



1er depot 
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ctg gtc cac ttc ctg ate ate cgc tac gga cac egg ctg atg ggc ggc 960 
Leu Val His Phe Leu lie He Arg Tyr Gly His Arg Leu Met Gly Gly 
305 310 315 320 

gat ctg ggc tac gag egg cag tgg age ace ccg gee gcg ate gcg ctg 1008 
Asp Leu Gly Tyr Glu Arg Gin Trp Ser Thr Pro Ala Ala lie Ala Leu 
325 330 335 



--feec-et-g-ggg—a-feg— efeg-ggg-gtg-gcg-gtc— ctg-gcc-ggc-ggt— ctg~ ctg -cac r05~6- 

Ser Leu Gly Met Leu Gly Val Ala Val Leu Ala Gly Gly Leu Leu His 
340 ,. . • 345 350 

ace gtc gtc gaa cag ccc tgc atg cgc ctg ttc ggc age cgc agg tec 1104 
Thr Val Val Glu Gin Pro Cys Met Arg Leu Phe Gly Ser Arg Arg Ser 
355 360 365 

gee tec cgt ccg aag ccc ggc gee ace gcg get ccc egg aac tea ccc 1152 
Ala Ser Arg Pro Lys Pro Gly Ala Thr Ala Ala Pro Arg Asn Ser Pro 
370 375 380 

gcg gee gac gcg gee ggc gtg ccc ctg etc ccg ggc gta ccc ggg ccc 1200 
Ala Ala Asp Ala Ala Gly Val Pro Leu Leu Pro Gly Val Pro Gly Pro 
3 85 390 395 400 

gcg cac acc ccc gca gcg acg aac gaa ccc ace ccg aga gga tga 1245 
Ala His Thr Pro Ala Ala Thr Asn Glu Pro Thr Pro Arg Gly 

405 410 415 



<210> 14 

. <211> 414 

<212> PRT 

<213> Streptomyces ambofaciens 

<400> 14 

Val Leu Gin Arg Val Asp Leu Ser Ser Leu Thr Gly Leu Arg Trp Tyr 
1 5 10 15 

Ala Ala Leu Thr Val Phe Ala Cys His He Ala Gin Gin Gly Phe Phe 
20 25 30 

Ala Asp Gin Gin Val Gly Ser Ala Leu Leu His He Thr Pro Leu Gly 
3 5 40 45 

Ser Met Ala Val Ser He Phe Phe He Leu Ser Gly Phe Val Leu Ala 
50 55 60 

Trp Ser Ala Arg Asp Glu Asp Ser Val Pro Thr Phe Trp Arg Arg Arg 
65 70 75 80 

He Ala Lys He Tyr Pro Leu His Leu Ala Thr Phe Gly He Ala Ala 
85 90 95 

Leu He He Phe Ser Leu Ser Glu Pro Val Leu Pro Gly Gly Ser Val 
100 105 110 

Trp Asp Gly Leu Val Pro Asn Val Leu Leu Val Gin Ser Trp Leu Pro 
115 120 125 

Asp Ala Thr Leu Thr Ala Ser Phe Asn Thr Pro Ser Trp Ser Leu Ser 
130 135 140 
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Cys Glu lie Ala Phe Tyr Leu Ser Phe Pro Leu Trp Tyr Arg Leu Val 
145 150 155 ~ 160 

Arg Arg lie Pro Ala Arg Arg Leu Trp Trp Cys Ala Ala Gly lie Ala 
165 170 175 

Val Ala Val Thr Cys Val Pro Leu Leu Ala Gly Leu Leu Pro Ala Ser 
180 185 190 

Glu Glu Val Ala Pro Gly Met Ser Leu Asn Glu Val Trp Phe Ala Tyr 
1^5 200 205 

Trp Leu Pro Pro Val Arg Met Leu Glu Phe Val Leu Gly He Val Met 
210 215 220 

Ala Leu He Leu Arg Ala Gly He Trp Lys Gly Pro Gly Pro Ala Val ■ 
225 230 235 240 

Cys Thr Ala Leu Leu Ala Ala Ser Tyr Gly Leu Thr Gin Met Val Pro 
245 250 255 

Pro He Phe Thr Leu Val Ala Cys Ser Val Val Pro Ala Ala Leu Leu 
2^0 265 270 

He Thr Ala Leu Ala Asp Ala Asp Val His Gly Arg Arg Thr Gly Leu 
27 5 280 285 

Arg Ser Ala Thr Leu Val Arg Leu Gly Gin Trp Ser Phe Ala Phe Tyr 
290 295 300 

Leu Val His Phe Leu He He Arg Tyr Gly His Arg Leu Met Gly Gly 
305 310 . 315 320 

Asp Leu Gly Tyr Glu Arg Gin Trp Ser Thr Pro Ala Ala He Ala Leu 
325 330 335 

Ser Leu Gly Met Leu Gly Val Ala Val Leu Ala Gly Gly Leu Leu His 
34 ° 345 350 

Thr Val Val Glu Gin Pro Cys Met Arg Leu Phe Gly Ser Arg Arg Ser 
355 360 365 

Ala Ser Arg Pro Lys Pro Gly Ala Thr Ala Ala Pro Arg Asn Ser Pro 
370 375 380 

Ala Ala Asp Ala Ala Gly Val Pro Leu Leu Pro Gly Val Pro Gly Pro 
385 3 ^0 395 " 400 

Ala His Thr Pro Ala Ala Thr Asn Glu Pro Thr Pro Arg Gly 
405 410 



<210> 15 
<211> 849 
<212> ADN 

<213> Streptomyces ambofaciens 



<220> 
<221> CDS 



1 er depot 
31 



<222> (1) . . (849) 
<400> 15 

gtg aca ttg aaa tec cca ctg cca ccg caa tec gtc tec gca ccc get 48 

Val Thr Leu Lys Ser Pro Leu Pro Pro Gin Ser Val Ser Ala Pro Ala 

1 5 10 15 

gat tea cgc age acc gcg egg aga gaa tgg ggt cag aac ttc ttt cgt 96 

Asp Ser Arg Ser Thr Ala Arg Arg Glu Trp Gly Gin Asn Phe Phe Arg 

- 20 -25 - - ~ 3 0" -~ - 



aca gee gee gcg gee tgt cgt ttc tec get cag ctg gac ggt teg gac 
Thr Ala Ala Ala Ala Cys Arg Phe Ser Ala Gin Leu Asp Gly Ser Asp 
3 5 4 0 45 



144 



acc att ccg ccc gat tct ccg aat gac ctg atg acc gtc gaa ata ggc 192 
Thr lie Pro Pro Asp Ser Pro Asn Asp Leu Met Thr Val Glu lie Gly 
50 55 60 

gcg gga tea ggg egg gtg acc aaa gtg etc gee tea ccc ggg acg cot 2 40 
Ala Gly Ser Gly Arg Val Thr Lys Val Leu Ala Ser Pro Gly Thr Pro 
65 7 0 75 80 

tta etc gcg gtg gaa ata gat ccc cgc tgg get egg egg ctg gec gee 2 88 
Leu Leu Ala Val Glu lie Asp Pro Arg Trp Ala Arg Arg Leu Ala Ala 
85 90 95 

gaa teg ctg ccg gac gtc acg gtg gtg aac gag gat ttc ctg acc ctg 336 
Glu Ser Leu Pro Asp Val Thr Val Val Asn Glu Asp Phe Leu Thr Leu 
100 105 110 

caa ctg ccc ggg cag ccg gtc aga etc ate ggg aat ctt ccc ttc gtc 3 84 
Gin Leu Pro Gly Gin Pro Val Arg Leu He Gly Asn Leu Pro Phe Val 
H5 120 125 

acc ggc acc aga atg ctg agg cgc tgc etc gac atg ggt ccg gcg cgc 432 
Thr Gly Thr Arg Met Leu Arg Arg Cys Leu Asp Met Gly Pro Ala Arg 
130 13 5 140 

atg egg cag ggc gtg ttc ctg ttg cag egg gag tac gtg gga aag egg 480 
Met Arg Gin Gly Val Phe Leu Leu Gin Arg Glu Tyr Val Gly Lys Arg 
145 150 155 160 

acc gga gec tgg ggc gga aac etc ttc aac gec cag tgg gag ccg tgg 528 
Thr Gly Ala Trp Gly Gly Asn Leu Phe Asn Ala Gin Trp Glu Pro Trp 
165 170 175 

tac teg ttc gac egg ggc ctg gee ttc tea cgc cag gac ttc acc ccc 576 
Tyr Ser Phe Asp Arg Gly Leu Ala Phe Ser Arg Gin Asp Phe Thr Pro 
180 185 190 

gta. ccg cgc gcg gac acc cag acc ctg atg gtc gec ccg cac cgc agg 62 4 
Val Pro Arg Ala Asp Thr Gin Thr Leu Met Val Ala Pro His Arg Arg 
195 200 205 

ccg tec gtg ccc tgg cgt gag aag gee gee tac cag egg ttc gtc caa 672 
Pro Ser Val Pro Trp Arg Glu Lys Ala Ala Tyr Gin Arg Phe Val Gin 
210 215 220 

egg gtc ttc gac acc ggc cag atg acg gtg ggc gac gee gcg egg aag 720 
Arg Val Phe Asp Thr Gly Gin Met Thr Val Gly Asp Ala Ala Arg Lys 
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225 230 235 



240 



gtg ctg cgc cgc gga cac gcc cag ttc gtg cgc ggg gcg ggc gtg agg 768 
Val Leu Arg Arg Gly His Ala Gin Phe Val Arg Gly Ala Gly Val Arg 
245 250 255 

ccg gcc gac egg gtc aag gac etc acg gtc ccg gag tgg acc gca etc 816 
Pro Ala Asp Arg Val Lys Asp Leu Thr Val Pro Glu Trp Thr Ala Leu 
260 265 270 



ttc cgc gcc tac ggg egg acg gcc gac cgc tga 
Phe Arg Ala Tyr Gly Arg Thr Ala Asp Arg 
275 280 



<210> 16 

<211> 282 

<212> PRT 

<213> Streptomyces ambofaciens 

<400> 16 

Val Thr Leu Lys Ser Pro Leu Pro Pro Gin Ser Val Ser Ala Pro Ala 
1 5 10 15 

Asp Ser Arg Ser Thr Ala Arg Arg Glu Trp Gly Gin Asn Phe Phe Arg 
20 25 30 

Thr Ala Ala Ala Ala Cys Arg Phe Ser Ala Gin Leu Asp Gly Ser Asp 
35 ■ 40 45 

Thr lie Pro- Pro Asp Ser Pro Asn Asp Leu Met Thr Val Glu lie Gly 
50 55 60 

Ala Gly Ser Gly Arg Val Thr Lys Val Leu Ala Ser Pro Gly Thr Pro 
65 70 75 ~ 80 

Leu Leu Ala Val Glu lie Asp Pro Arg Trp Ala Arg Arg Leu Ala Ala 
85 90 95 

Glu Ser Leu Pro Asp Val Thr Val Val Asn Glu Asp Phe Leu Thr Leu 
100 105 HO 

Gin Leu Pro Gly Gin Pro Val Arg Leu He Gly Asn Leu Pro Phe Val 
115 120 125 

Thr Gly Thr Arg Met Leu Arg Arg Cys Leu Asp Met Gly Pro Ala Arg 
13 0 135 14Q 

Met Arg Gin Gly Val Phe Leu Leu Gin Arg Glu Tyr Val Gly Lys Arg 
145 150 155 160 

Thr Gly Ala Trp Gly Gly Asn Leu Phe Asn Ala Gin Trp Glu Pro Trp 
165 • 170 ' 175 

Tyr Ser Phe Asp Arg Gly Leu Ala Phe Ser Arg Gin Asp Phe Thr Pro 
180 185 190 

Val Pro Arg Ala Asp Thr Gin Thr Leu Met Val Ala Pro His Aro Arg 
195 2 00 2 05 

Pro Ser Val Pro Trp Arg Glu Lys Ala Ala Tyr Gin Arg Phe Val Gin 



849 
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210 215 220 

Arg Val Phe Asp Thr Gly Gin Met Thr Val Gly Asp Ala Ala Arg Lys 
225 230 235 240 

^wwl x^s^ oxjr iixo nxci oxu jrn« vclx Q Vj _l y AXd. icr j_y Vcix >vi y 

245 250 ~ 255 

.Pro Ala. Asp- Arg Val Lys Asp -Leu Thr Val -Pro- Glu Trp- Thr Ala Leu 
260 265 270 

Phe Arg Ala Tyr Gly Arg Thr Ala Asp Arg 
275 280 



<210> 17 
<211> 831 
<212> ADN 

<213> Streptomyces ambofaciens 

<220> 

<221> CDS 

<222> (1) . . (831) 

<400> 17 

gtg aag gag gtg gcg gtc gac acc ggt acc ccg gcc ggc cce gtg tgg 48 

Val Lys Glu Val Ala Val Asp Thr Gly Thr Pro Ala Gly Pro Val Trp 
15 10 15 

cgt ggt gcc ggc etc ggc acc cag ctg tgg gta ctg acc gcg egg cag 9 6 
Arg Gly Ala Gly Leu Gly Thr Gin Leu Trp Val Leu Thr Ala Arg Gin 
20 25 30 

ate cgt tec atg tac ggc gac cgc cgc ctg gcg ctg ttc age ctg atg 144 
lie Arg Ser Met Tyr Gly Asp Arg Arg Leu Ala Leu Phe Ser Leu Met 
35 40 45 

caa ccg gtg ate atg ctg ttg ctg ctg age gag ate ttc ggc age atg 192 
Gin Pro Val lie Met Leu Leu Leu Leu Ser Glu lie Phe Gly Ser Met 
50 55 60 

gcc gac ccg gac gac ttc ccg cag ggc gtg cgc tac ate gac tac gtg 240 
Ala Asp Pro Asp Asp Phe Pro Gin Gly Val Arg Tyr lie Asp Tyr Val 
65 7 0 7 5 80 

gtg ccc gcg ctg ctg gtc acc acc ggc ate ggc teg gcc cag ggc gcg 2 88 
Val Pro Ala Leu Leu Val Thr Thr Gly lie Gly Ser Ala Gin Gly Ala 
85 90 95 

ggg gtg ggc ctg gtc agg gac atg gac aac ggg atg gtg gcg cgc ttc 33 6 
Gly Val Gly Leu Val Arg Asp Met Asp Asn Gly Met Val Ala Arg Phe 
100 105 110 

cgc gtc ctg ccg gcc egg ctg ttc ctg gtg ctg gtc gcc egg teg ctg 3 84 
Arg Val Leu Pro Ala Arg Leu Phe Leu Val Leu Val Ala Arg Ser Leu 
115 120 125 



gcc gat ctg gtc cgt gtg 
Ala Asp Leu Val Arg Val 
130 



ttc acc gag ttg gtc gtc etc gtg gcc gtc 
Phe Thr Glu Leu Val Val Leu Val Ala Val 
135 140 



432 
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ggt 

Gly 
145 


gtg 

Val 


ate 
He 


ctg 
Leu 


ctg 
Leu 


ggc 
Gly 
150 


ttc 
Phe 


cgt 
Arg 


ccg gcc ggg 
Pro Ala Gly 
155 


ggt ttg 
Gly Leu 


tgg 
Trp 


ggc acg 
Gly Thr 
160 


480 


tec 
Ser 


gcc 
Ala 


gcc 
Ala 


ctg 
Leu 


ttg 
Leu 
165 


etc 
Leu 


ace 
Thr 


ctg 
Leu 


ttc 
Phe 


gtc 
Val 
170 


ate 
He 


tgg 
Trp 


teg 
Ser 


ctg 
Leu 


ate 
He 
175 


tgg 
Trp 


528 


ggg 

Gly 


ttc 
Phe 


ate 
He 


gcc 
Ala 
180 


etc 
Leu 


gcg 
Ala 


gcg 
Ala 


tgg 
Trp 


ctg 
Leu 
185 


cgc 
Arg 


age 
Ser 


gtg 
Val 


gag 
Glu 


gtg 
Val 
190 


atg 
Met 


tec 
Ser 


576 


age 
Ser 


etc 
Leu 


gcg 
Ala 
195 


gtt 

Val 


ctg 
Leu 


gtg 
Val 


atg 
Met 


ttc 
Phe 
200 


ccg 
Pro 


etc 
Leu 


atg 
Met 


ttc 
Phe 


gcc 
Ala 
205 


tec 
Ser 


agt 
Ser 


gcg 

Ala 


624 


ttc 
Phe 


gtc 
Val 
210 


ccg 
Pro 


ctg 
Leu 


gac 
Asp 


gcc 
Ala 


etc 
Leu 
215 


ccg 
Pro 


gag 
Glu 


tgg 
Trp 


ctg 
Leu 


cgc 
Arg 
220 


teg 
Ser 


crtcr 
Val 


gcg 
Ala 


eac 
His 


672 


etc 
Leu 
225 


aac 
Asn 


ccc 
Pro 


gtg 

Val 


acg 
Thr 


tac 
Tyr 
230 


gcg 
Ala 


gtc 
Val 


gac 
Asp 


age 
Ser 


gcc 
Ala 
235 


cgc 
Arg 


cgc 
Arg 


ctg 
Leu 


gcg 
Ala 


ctg 
Leu 
240 


720 


gac 
Asp 


tgg 
Trp 


gac 
Asp 


ccg 
Pro 


ggg 

Gly 
245 


tgg 
Trp 


age 
Ser 


gtg 
Val 


ccc 
Pro 


ggc 

Gly 
250 


gcg 
Ala 


ctg 
Leu 


ctg 
Leu 


acc 
Thr 


age 
Ser 
255 


acc 
Thr 


768 


gcg 
Ala 


etc 
Leu 


atg 
Met* 


gcg 

Ala 
260 


gtg 
Val 


ggg 

Gly 


atg 
Met 


tac 
Tyr 


gtc 
Val 
265 


gcc ggg cgt 
Ala Gly Arg 


tec 
Ser 


ttc 
Phe 
270 


aag 
Lys 


agg 
Arg 


' 816 


ccc 
Pro 


ccg 
Pro 


aac 
Asn 


gaa 
Glu 


tga 
























831 



275 



<210> 18 
<211> 276 
<212> PRT 

<213> Streptomyces ambof aciens 
<400> 18 

Val- Lys Glu Val Ala Val Asp Thr Gly Thr Pro Ala Gly Pro Val Trp 
15 10 15 

Arg Gly Ala Gly Leu Gly Thr Gin Leu Trp Val Leu Thr Ala Arg Gin 
20 25 30 

He Arg Ser Met Tyr Gly Asp Arg Arg Leu Ala Leu Phe Ser Leu Met 
35 40 45 

Gin Pro Val He Met Leu Leu Leu Leu Ser Glu He Phe Gly Ser Met 
50 55 60 

Ala Asp Pro Asp Asp Phe Pro Gin Gly Val Arg Tyr He Asp Tyr Val 
65 70 75 80 

Val Pro Ala Leu Leu Val Thr Thr Gly He Gly Ser Ala Gin Gly Ala 
85 90 95 
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Gly Val Gly Leu Val Arg Asp Met Asp Asn Gly Met Val Ala Arg Phe 
100 105 HO 

Arg Val Leu Pro Ala Arg Leu Phe Leu Val Leu Val Ala Arg Ser Leu 
n5 120 125 

Ala Asp Leu Val Arg Val Phe Thr Glu Leu Val Val Leu Val Ala Val 
13-Q- - - 13.5 . -140 - - 

Gly Val lie Leu Leu Gly Phe Arg Pro Ala Gly Gly Leu Trp Gly Thr 
145 150 155 160 

Ser Ala Ala Leu Leu Leu Thr Leu Phe Val lie Trp Ser Leu He Trp 
16 5 170 175 

Gly Phe He Ala Leu Ala Ala Trp Leu Arg Ser Val Glu Val Met Ser 
180 185 190 

Ser Leu Ala Val Leu Val Met Phe Pro Leu Met Phe Ala Ser Ser Ala 
195 200 205 

Phe Val Pro Leu Asp Ala Leu Pro Glu Trp Leu Arg Ser Val Ala His 
210 215 220 

Leu Asn Pro Val Thr Tyr Ala Val Asp Ser Ala Arg Arg Leu Ala Leu 
225 230 235 240 

Asp Trp Asp Pro Gly Trp Ser Val Pro Gly Ala Leu Leu Thr Ser Thr 
245 250 255 

Ala Leu Met Ala Val Gly Met Tyr Val Ala Gly Arg Ser Phe Lys Arg 
26 0 265 270 

Pro Pro Asn Glu 
275 



<210> 19 
<211> 882 
<212> ADN 

<213> Streptomyces ambofaciens 

<220> 

<221> CDS 

<222> (1) . . (882) 

<400> 19 

gtg gac ate gag gtc gaa egg ggc egg 

Val Asp He Glu Val Glu Arg Gly Arg 

1 5 

aac ggg gec ggc aag acg acc ttg gtg 
Asn Gly Ala Gly Lys Thr Thr Leu Val 
20 25 

ccg gcg tec gcg ggc acg gtg acc gtc 
Pro Ala Ser Ala Gly Thr Val Thr Val 
35 40 



gtg etc ggg ctg ctg ggt cac 48 
Val Leu Gly Leu Leu Gly His 
10 15 

aac ate ctt gec acg gtc tec 96 
Asn He Leu Ala Thr Val Ser 
30 

gec ggt ttc gac gtc gcg acg 144 
Ala Gly Phe Asp Val Ala Thr 
45 



1er depot 
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cag ggc gcc gag ate cgc gcg cgc ate ggg gtg ace ggc cag ttc gcg 192 

Gin Gly Ala Glu lie Arg Ala Arg He Gly Val Thr Gly Gin Phe Ala 
50 55 60 

teg gtg gac gag tac ctg age gga ttc cgc aac etc gtc ctg ate ggc 240 

Ser Val Asp Glu Tyr Leu Ser Gly Phe Arg Asn Leu Val Leu He Gly 
65 70 75 80 

cgc etc etc ggg gcg gga egg cgt gag gcg gcg gcc egg gcc ace gag 2 88 

Arg Leu Leu Gly Ala Gly Arg Arg Glu Ala Ala Ala Arg Ala Thr Glu 
85 90 95 

etc ctg gag ctg ttc gag ctg ace ggg gcg gcc cac cag ccc tec cgc 336 

Leu Leu Glu Leu Phe Glu Leu Thr Gly Ala Ala His Gin Pro Ser Arg 

100 105 110 

ace tac teg ggc ggg atg cgc cga egg etc gac etc gcc gcc age ctg 3 84 

Thr Tyr Ser Gly Gly Met Arg Arg Arg Leu Asp Leu Ala Ala Ser Leu 
115 120 125 

gtc ggc egg ccg gac gtg ctg ttc etc gac gag ccg acg acc ggg ctg 432 

Val Gly Arg Pro Asp Val Leu Phe Leu Asp Glu Pro Thr Thr Gly Leu 
130 135 140 

gac ccg gcg acc egg ate gcc ctg tgg gag acg gtg gag aag ctg gtg 480 

Asp Pro Ala Thr Arg He Ala Leu Trp Glu Thr Val Glu Lys Leu Val 
145 150 155 160 

gcg ggc ggc acg acc gtc ctg ctg acc acc cag tac ctg gac gag gcg 52 8 

Ala Gly Gly Thr Thr Val Leu Leu Thr Thr Gin Tyr Leu Asp Glu Ala 
165 170 175 

gac egg ctg gcc gac tgg ate acc gtc ctg teg aag ggc egg gtg gtg 57 6 

Asp Arg Leu Ala Asp Trp He Thr Val Leu Ser Lys Gly Arg Val Val 

180 185 190 

gcc teg gac acc acc gac egg etc aag gcc gac ctg ggc cac egg teg 62 4 

Ala Ser Asp Thr Thr Asp Arg Leu Lys Ala Asp Leu Gly His Arg Ser 
195 200 205 

gtg egg gtg gtc ctt ccg ccc gcc gcc gac ctg acg gcc gcc gcc gcc 672 

Val Arg Val Val Leu Pro Pro Ala Ala Asp Leu Thr Ala Ala Ala Ala 
210 215 220 

gcg etc acc gcc ggc ggg ttc cgt ccg egg tec gac gcc ggg gag cac 72 0 

Ala Leu Thr Ala Gly Gly Phe Arg Pro Arg Ser Asp Ala Gly Glu His 
225 230 235 240 

gcg ctg acc acg ccc gtg gac acc teg gcc ggt ate gcg ggc gtc ate 768 

Ala Leu Thr Thr Pro Val Asp Thr Ser Ala Gly He Ala Gly Val He 
245 250 255 

cgc gcg ctg gac acc gtc gga acg cag gcc gtc gag ctg acc gtc aag 816 

Arg Ala Leu Asp Thr Val Gly Thr Gin Ala Val Glu Leu Thr Val Lys 

260 265 270 

gag ccg tec ctg gac gac gtc tac ctg gcg etc acc cat ccc tea ccc 864 

Glu Pro Ser Leu Asp Asp Val Tyr Leu Ala Leu Thr His Pro Ser Pro 
275 280 285 



gcc gcc gac gcg gcc tga 



882 
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Ala Ala Asp Ala Ala 
290 



<210> 20 
<211> 293 
<212> PRT 

<213> Streptomyces ambofaciens 
<400> 20 

Val Asp He Glu Val Glu Arg Gly Arg Val Leu Gly Leu Leu Gly His 

Asn Gly Ala Gly Lys Thr Thr Leu Val Asn lie Leu Ala Thr Val Ser 
20 25 30 

Pro Ala Ser Ala Gly Thr Val Thr Val Ala Gly Phe Asp Val Ala Thr 
35 40 45 

Gin Gly Ala Glu He Arg Ala Arg He Gly Val Thr Gly Gin Phe Ala 
50 55 60 

Ser Val Asp Glu Tyr Leu Ser Gly Phe Arg Asn Leu Val Leu He Gly 
65 70 75 80. 

Arg Leu Leu Gly Ala Gly Arg Arg Glu Ala Ala Ala Arg Ala Thr Glu 
85 90 95 

Leu Leu Glu Leu Phe Glu Leu Thr Gly Ala Ala His Gin Pro Ser Arg 
100 105 110 

Thr Tyr Ser Gly Gly Met Arg Arg Arg Leu Asp Leu Ala Ala Ser Leu 
115 120 125 

Val Gly Arg Pro Asp Val Leu Phe Leu Asp Glu Pro Thr Thr Gly Leu 
130 135 140 

Asp Pro Ala Thr Arg lie Ala Leu Trp Glu Thr Val Glu Lys Leu Val 
145 150 155 160 

Ala Gly Gly Thr Thr Val Leu Leu Thr Thr Gin Tyr Leu Asp Glu Ala 
165 170 1?5 

Asp Arg Leu Ala Asp Trp He Thr Val Leu Ser Lys Gly Arg Val Val 
180 185 19G 

Ala Ser Asp Thr Thr Asp Arg Leu Lys Ala Asp Leu Gly His Arg Ser 
195 200 205 

Val Arg Val Val Leu Pro Pro Ala Ala Asp Leu Thr Ala Ala Ala Ala 
210 215 220 

Ala Leu Thr Ala Gly Gly Phe Arg Pro Arg Ser Asp Ala Gly Glu His 
225 230 235 240 

Ala Leu Thr Thr Pro Val Asp Thr Ser Ala Gly lie Ala Gly Val lie 
245 250 255 

Arg Ala Leu Asp Thr Val Gly Thr Gin Ala Val Glu Leu Thr Val Lys 
260 265 270 
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Glu Pro Ser Leu Asp Asp Val Tyr Leu Ala Leu Thr His Pro Ser Pro 
275 280 285 

Ala Ala Asp Ala Ala 
290 



<210> 21 
<211> 228 
<212> ADN 

<213> Streptomyces ambofaciens 

<220> 

<221> CDS 

<222> (1) . . (228) 

<400> 21 

atg age aac ccg ttc gag gac acg gaa gec acc tac gtc gtg ctg gtc 48 

Met Ser Asn Pro Phe Glu Asp Thr Glu Ala Thr Tyr Val Val Leu Val 
1 5 10 15 

aac gac gag ggg cag cac teg ctg tgg ccg teg ttc gcg gag gtc ccg 96 
Asn Asp Glu Gly Gin His Ser Leu Trp Pro Ser Phe Ala Glu Val Pro 
20 25 30 

gcg ggc tgg tec gtc gtg gtg ccg gag acg gac egg cag teg tgc ctg 144 
Ala Gly Trp Ser Val Val Val Pro Glu Thr Asp Arg Gin Ser Cys Leu 
35 40 45 

gac tac ate aac gag aac tgg acc gac atg cgc ccc aag age etc gtc 192 
Asp Tyr lie Asn Glu Asn Trp Thr Asp Met Arg Pro Lys Ser Leu Val 
5 0 . 55 - 60 

gag gcg atg gcg acg gee ggg cag gac gee cct tga 22 8 

Glu Ala Met Ala Thr Ala Gly Gin Asp Ala Pro 
65 70 75 



<210> 22 

<211> 75 

<212> PRT 

<213> Streptomyces ambofaciens 

<400> 22 

Met Ser Asn Pro Phe Glu Asp Thr 
1 5 

Asn Asp Glu Gly Gin His Ser Leu 
20 

Ala Gly Trp Ser Val Val Val Pro 
35 40 

Asp Tyr He Asn Glu Asn Trp Thr 
50 55 

Glu Ala Met Ala Thr Ala Gly Gin 
65 70 



Glu Ala Thr Tyr Val Val Leu Val 
10 15 

Trp Pro Ser Phe Ala Glu Val Pro 
25 30 

Glu Thr Asp Arg Gin Ser Cys Leu 
45 

Asp Met Arg Pro Lys Ser Leu Val 
60 

Asp Ala Pro 
75 
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48 



96 



144 



<210> 23 
<211> 1212 
<212> ADN 

<213> Streptomyces ambof aciens 

<220> 

<221> CDS 

<222> (1) . . (1212) _ 

<400> 23 . 

Se? G?v fit f ? ^ a Ctg agC aag * aC *ac 

Met Gly Glu Ala Val Thr Gly Pro Met Glu Leu Ser Lys Asp Ala Asp 

5 10 15 

111 2a SS r Ctt ttC taC aaC agg c St cat ccg 

Ala Arg Gly Leu Leu Glu Trp Phe Ala Tyr Asn Arg Thr Arg His Pro 

20 25 30 

£? ^° ^ g gaC aC ° ° ga Cag gcg tSTST cag gtc ttc ggc tac gac 

Val Phe Trp Asp Glu Thr Arg Gin Ala Trp Gin Val Phe cgy Tsp 
Jb 40 '45 

Sp Ty"r ?a? Tnr" £? ^ ^ ttC ttC tCC tCg ffac ttc 192 

T ^ Val Thr Val Ser Asn Asn Pro Gin Phe Phe Ser Ser Asp Phe 
50 55 60 

aac atg gtg atg ccg acg ccg ccc gaa ctg gag atg ate ate orat rcn o/m 
Asn Met Val Met Pro Thr Pro Pro Glu Leu Glu Met He III ily Pro 

Sfy xS Se Glv SK f C ^ " a CCg atg CgC aag 

c±y inr lie Gly Ala Leu Asp Pro Pro Ala His Gly Pro Met Arg Lys 

85 90 95 

2 ?af Ser III lit COT &tC gC ° Cgg Ctg ™> ccc 336 

val Ser Gin Ala Phe Thr Pro Arg Arg lie Ala Arg Leu Glu Pro 

100 105 110 

S Jal Arg j£ ££ SS 2?° r*" ^ ^ ^ C ^ 384 

y ax Arg Ala lie Thr Glu Glu Leu Leu Asp Lys Val Gly Gin Gin 

115 120 125 



Sp S Sax !? v i Sf gaC Ctg tCC tac W ct ^ <=cg Btc ate 

Asp val Val Asp Ala Val Gly Asp Leu Ser Tyr Ala Leu Pro Val He 

130 135 140 

Sal xlt ?r ri* Ctg ^ ata CCC gCC ggc gac cgt <3*c ctg ttc 

Val lie Ala Glu Leu Leu Gly He Pro Ala Gly Asp Arg Asp Leu Phe 

150 155 1 60 

Ira Glu T C ^ ° Ctg Ctg 309 aaC gag ggc ctg ccg 

Arg Glu Tip Val Asp Thr Leu Leu Thr Asn Glu Gly Leu Glu Tyr Pro 

165 170 175 

T Ct ° o° 9 aaC ttC aCC gag acg atc 3og ccc gcg etc aag gag 

Asn Leu Pro Asp Asn Phe Thr Glu Thr He Ala Pro hi Leu Lys £S 
180 185 190 ' 



^ C r C CtC Ctg aag Cag atc cac 9 CC aa 9 egg gac gcg ccc 

Met Thr Asp Tyr Leu Leu Lys Gin lie His Ala Lys Arg Asp Ala Pro 



432 



480 



528 



576 



624 
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195 200 205 

gcc gac gac ctg gtc age ggg ctg gtc cag gcg gag cag gac ggc cgc 672 
Ala Asp Asp Leu Val Ser Gly Leu Val Gin Ala Glu Gin Asp Gly Arg 
210 215 220 

egg ctg acc gac gtc gag ate gtc aac ate gtc gcg ctg etc ctg acg 72 0 
Arg Leu Thr Asp Val Glu He Val Asn He Val Ala Leu Leu Leu Thr 
225 230 235 240 

gcg ggg cac gtc tec tec age acc ctg etc age aac ctg ttc ctg gtc 768 
Ala Gly His Val Ser Ser Ser Thr Leu Leu Ser Asn Leu Phe Leu Val 
245 250 255 

ctg gag gag aac ccg cag gcg ctg gag gac ctg egg gcc gat cgc tec 816 
Leu Glu Glu Asn Pro Gin Ala Leu Glu Asp Leu Arg Ala Asp Arg Ser 
260 265 270 

ctg gtg ccc ggc gcg ate gag gag acg ctg cgc tac cgc age ccc ttc 864 
Leu Val Pro Gly Ala He Glu Glu Thr Leu Arg Tyr Arg Ser Pro Phe 
275 280 285 

aac aac ate ttc egg ttc gtc aag gag gac acc acc gtc etc ggt ccg 912 
Asn Asn He -Phe Arg Phe Val Lys Glu Asp Thr Thr Val Leu Gly Pro 
290 295 300 

etc atg gag aag ggc cag atg gtg ate gcc tgg age cag tec gcc aac 960 
Leu Met Glu Lys Gly Gin Met Val He Ala Trp Ser Gin Ser Ala Asn 
305 . 310 315 320 

egg gac ccc egg cac ttc ccg gac ccg gac acc ttc gac ate cgc cgc 1008 
Arg Asp Pro Arg His Phe Pro Asp Pro Asp Thr Phe Asp He Arg Arg 
325 . 330 335 

teg gac ggc acc egg cac atg gcc ttc ggg cac ggc ate cac cac tgc 1056 
Ser Asp Gly Thr Arg His Met Ala Phe Gly His Gly He His His Cys 
340 345 350 

ctg ggt gcc gcc etc gcc cgc ctg gag ggc aag gtc atg etc gaa etc 1104 
Leu Gly Ala Ala Leu Ala Arg Leu Glu Gly Lys Val Met Leu Glu Leu 
355 360 365 

etc ctg gac egg gtc caa ggc ttc cgc ate gac cac gag cac acc gtg 1152 
Leu Leu Asp Arg Val Gin Gly Phe Arg He Asp His Glu His Thr Val 
370 375 380 

ttc tac gag gcc gac cag etc act ccg aag tac ctg ccc gtc egg gtc 1200 
Phe Tyr Glu Ala Asp Gin Leu Thr Pro Lys Tyr Leu Pro Val Arg Val 
385 390 395 400 

gac tgg aac tga 1212 
Asp Trp Asn 



<210> 24 

<211> 403 

<212> PRT 

<213> Streptomyces 



ambof aciens 



<400> 24 

Met Gly Glu Ala Val Thr Gly Pro Met Glu Leu Ser Lys Asp Ala Asp 
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5 10 15 

Ala Arg Gly Leu Leu Glu Trp Phe Ala Tyr Asn Arg Thr Arg His Pro 
20 25 30 

Val Pbl= Tm a=1-v Oil-. TYK,- TV ■» 1 _ , - 

--i- '"a um t±±d rrp uxn vai pne Gly Tyr Asp 

35 40 45 

_.Asp_Ty_r_yal._Thr-_Val_-Ser_Asii_Asn--p.re-Gl-n-Phe--Phe--Ser-Ser-A-sp-phe- 
50 55 60 

Asn Met Val Met Pro Thr Pro Pro Glu Leu Glu Met lie lie Gly Pro 
■ 65 70 75 80 

Gly Thr lie Gly Ala Leu Asp Pro Pro Ala His Gly Pro Met Arg Lys 
85 90 95 

Leu Val Ser Gin Ala Phe Thr Pro Arg Arg lie Ala Arg Leu Glu Pro 
100 i 0 5 11Q 

Arg Val Arg Ala lie Thr Glu Glu Leu Leu Asp Lys Val Gly Gin Gin 
115 120 125 

Asp Val Val Asp Ala Val Gly Asp Leu Ser Tyr Ala Leu Pro Val lie 
130 135 140 

Val He Ala Glu Leu Leu Gly He Pro Ala Gly Asp Arg Asp Leu Phe 
145 150 155 ' ' 160 

Arg Glu Trp Val Asp Thr Leu Leu Thr Asn Glu Gly Leu Glu Tyr Pro 
165 170 175 

Asn Leu Pro Asp Asn Phe Thr Glu Thr He Ala Pro Ala Leu Lys Glu 
180 185 190 

Met Thr Asp Tyr Leu Leu Lys Gin He His Ala Lys Arg Asp Ala Pro 
195 200 205 

Ala Asp Asp Leu Val Ser Gly Leu Val Gin Ala Glu Gin Asp Gly Arg 
210 215 220 

Arg Leu Thr Asp Val Glu He Val Asn lie Val Ala Leu Leu Leu Thr 
225 230 235 240 

Ala Gly His Val Ser Ser Ser Thr Leu Leu Ser Asn Leu Phe Leu Val 
245 250 255 

Leu Glu Glu Asn Pro Gin Ala Leu Glu Asp Leu Arg Ala Asp Arg Ser 
260 265 270 

Leu Val Pro Gly Ala He Glu Glu Thr Leu Arg Tyr Arg Ser Pro Phe 
275 280 285 

Asn Asn lie Phe Arg Phe Val Lys Glu Asp Thr Thr Val Leu Gly Pro 
290 295 300 

Leu Met Glu Lys Gly Gin Met Val He Ala Trp Ser Gin Ser Ala Asn 
305 310 315 320 

Arg Asp Pro Arg His Phe Pro Asp Pro Asp Thr Phe Asp He Arg Arg 
325 330 335 
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Ser Asp Gly Thr Arg His Met Ala 
340 

Leu Gly Ala Ala Leu Ala Arg Leu 
355 360 

Leu Leu Asp Arg Val Gin Gly Phe 
370 375 

Phe Tyr Glu Ala Asp Gin Leu Thr 
385 390 

Asp Trp Asn 



Phe Gly His Gly He His His Cys 
345 350 

Glu Gly Lys Val Met Leu Glu Leu 
365 

Arg He Asp His Glu His Thr Val 
3 80 

Pro Lys Tyr Leu Pro Val Arg Val 
395 400 



<210> 25 
<211> 540 
<212> ADN 

<213> Streptoinyces ambofaciens 

<220> 

<221> CDS 

<222> (1) . . (540) 

<220> 

<221> CDS 

<222> (190) . . (540) 

<400> 25 

ctg aac ccg agg gtc teg tec egg agt cca ggg ccg tec cga gee ggc 48 

Leu Asn Pro Arg Val Ser Ser Arg Ser Pro Gly Pro Ser Arg Ala Gly 

! ~ 5 10 15 

cct gga cct cac gac cgc ccg ata agg age gee gee ate gee gag aac 9 6 
Pro Gly Pro His Asp Arg Pro He Arg Ser Ala Ala lie Ala Glu Asn 
20 25 30 

aca gee gag etc cct gee egg egg gtc ggc agg ate aag ccg tgc egg 144 
Thr Ala Glu Leu Pro Ala Arg Arg Val Gly Arg He Lys Pro Cys Arg 
35 ' 40 45 

ctg ate agg etc gag cag cac ate gac ccg cgc ggc age etc tec gtg 192 
Leu He Arg Leu Glu Gin His He Asp Pro Arg Gly Ser Leu Ser Val 
50 ~ 55 60 

ate gag tec ggc gtg ace gtg gac ttc ccc gtc cga cgc gtc tac tac 240 
lie Glu Ser Gly Val Thr Val Asp Phe Pro Val Arg Arg Val Tyr Tyr 
65. 70 75 80 

atg cat ggc cag ace cag tec tct ccc ccg cgc ggc ctg cac gcg cac 2 88 
Met His Gly Gin Thr Gin Ser Ser Pro Pro Arg Gly Leu His Ala His 
85 90 95 

cgc acc ctg gaa caa etc gtc ate gee gtc cac ggc gec ttc tec ate 33 6 
Arg Thr Leu Glu Gin Leu Val He Ala Val His Gly Ala Phe Ser He 
100 105 HO 

acc etc gac gac ggc ttc cag cac gee acc tac cgt ctg gac gaa ccc. 384 
Thr Leu Asp Asp Gly Phe Gin His Ala Thr Tyr Arg Leu Asp Glu Pro 
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115 

gga gcc gga etc tgc ate 
Gly Ala Gly Leu Cys He 
130 

ttc gac ccc gac acc gtg 
Phe Asp Pro Asp Thr Val 
145 _ 150. 

gag tec gac tac tac cgc 
Glu Ser Asp Tyr Tyr Arg 
165 

age etc aca tga 
Ser Leu Thr 

180 



120 

ggc ccc atg gtc tgg cgc 

Gly Pro Met Val Trp Arg 

135 140 

gcc ctg gtc etc gcc teg 
Ala Leu Val Leu Ala Ser 

■- - 155 

gac tac gac acc ttc ctg 
Asp Tyr Asp Thr Phe Leu 



125 

gtc ctg aag gac 432 
Val Leu Lys Asp 



cag cac tac gag 480 
Gin His Tyr Glu 

_ 16 . 0 .... ..... 

cat gac gca egg '52 8 
His Asp Ala Arg 
175 

540 



<210> 26 
<211> 179 
<212> PRT 

<213> Streptomyces ambofaciens 
<400> 26 

Leu Asn Pro Arg Val Ser Ser Arg Ser Pro Gly Pro Ser Arg Ala Gly 
15 10 15 

Pro Gly Pro His Asp Arg Pro He Arg Ser Ala Ala He Ala Glu Asn 
20 25 30 

Thr Ala Glu Leu Pro Ala Arg Arg Val Gly Arg He Lys Pro Cys Arg 
35 40 45 

Leu He Arg Leu Glu Gin His He Asp Pro Arg Gly Ser Leu Ser Val 
50 55 60 

He Glu Ser Gly Val Thr Val Asp Phe Pro Val Arg Arg Val Tyr Tyr 
65 7 0 75 " ~ 80 

Met His Gly Gin Thr Gin Ser Ser Pro Pro Arg Gly Leu His Ala His 
85 90 95 

Arg Thr Leu Glu Gin Leu Val He Ala Val His Gly Ala Phe Ser He 
100 105 110 

Thr Leu Asp Asp Gly Phe Gin His Ala Thr Tyr Arg Leu Asp Glu Pro 
115 120 125 

Gly Ala Gly Leu Cys He Gly Pro Met Val Trp Arg Val Leu Lys Asp 
130 135 140 

Phe Asp Pro Asp Thr Val Ala Leu Val Leu Ala Ser Gin His Tyr Glu 
145 150 155 160 

Glu Ser Asp Tyr Tyr Arg Asp Tyr Asp Thr Phe Leu His Asp Ala Arg 
165 170 175 

Ser Leu Thr 
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<210> 27 
<211> 116 
<212> PRT 

<213> Streptomyces ambofaciens 
<400> 27 

Val He Glu Ser Gly Val Thr Val Asp Phe Pro Val Arg Arg Val Tyr 
1 5 10 15 

Tyr Met His Gly Gin Thr Gin Ser Ser Pro Pro Arg Gly Leu His Ala 
20 25 30 

His Arg Thr Leu Glu Gin Leu Val He Ala Val His Gly Ala Phe Ser 
35 40 45 

lie Thr Leu Asp Asp Gly Phe Gin His Ala Thr Tyr Arg Leu Asp Glu 
50 55 60 

Pro Gly Ala Gly Leu Cys lie Gly Pro Met Val Trp Arg Val Leu Lys 
65 70 75 80 

Asp Phe Asp Pro Asp Thr Val Ala Leu Val Leu Ala Ser Gin His Tyr 
85 90 95 

Glu Glu Ser Asp Tyr Tyr Arg Asp Tyr Asp Thr Phe Leu His Asp Ala 
100 105 110 

Arg Ser Leu Thr 
115 



<210> 28 
<211> 1167 
<212> ADN 

<213> Streptomyces ambofaciens 

<220> 

<221> CDS 

<222> (1) . (1167) 

<400> 28 

atg acc ate ccc ttc etc gac gcg ggc gec ggc tac egg gag ttg cga 48 

Met Thr He Pro Phe Leu Asp Ala Gly Ala Gly Tyr Arg Glu Leu Arg 
1 5 10 15 

gee gag ate gac gcg gec ctg cag egg gtg tec gee tec ggc cgc tat 9 6 
Ala Glu He Asp Ala Ala Leu Gin Arg Val Ser Ala Ser Gly Arg Tyr 
20 25 30 

ctg etc gac gcg gaa etc gcg gee ttc gag gag gag ttc gee gcg tac 144 
Leu Leu Asp Ala Glu Leu Ala Ala Phe Glu Glu Glu Phe Ala Ala Tyr 
35 40 45 ' 

tgc gac aac gac cac tgt gtg gcg gtg ggc agt ggc tgc gac gcg ctg 192 
Cys Asp Asn Asp His Cys Val Ala Val Gly Ser Gly Cys Asp Ala Leu 
50 55 60 

gag ctg tec ctg egg gcg ctg gac ate ggt ccc ggg gac gag gtg gtg 240 
Glu Leu Ser Leu Arg Ala Leu Asp He Gly Pro Gly Asp Glu Val Val 
6 5 70 75 80 
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Sal p™ J?? ^ C £ C atC ggg aCC tgg ctg gcc gtg tcc gc t acc 
Val Pro Ala His Thr Phe lie Gly Thr Trp Leu Ala Val Ser Ala Thr 



288 



85 90 



95 



QQCS CTCa COcr nnrr rrf-rr rxr-r-, — . . . . 

rTw »i = ycLl " '"^ aug ccg gac 599 c tc tcc etc 336 

Gly Ala Arg Pro Val Ala Val Asp Pro Thr Pro Asp Gly Leu Ser Leu 

100 105 HO 

gac ccg gcg ctg gtg gag gcg gcg etc acc cct egg acc aga gec ctg 384 
Asp Pro Ala Leu Val Glu Ala Ala Leu Thr Pro Arg Thr Arg Ala LeS ' 
H5 120 125 

nil Pro T Ct9 S 3C ggg cac ccg gcc gac ctc gac ccg Cta Ctg 432 

Met Pro Val His Leu His Gly His Pro Ala Asp Leu Asp Pro Leu Leu 

13° 135 140 

til Til %T ^ CaC ggC ° tg gCC gtg gtc gag gac gcc scg cag 480 

Ala He Ala Gly Arg His Gly Leu Ala Val Val Glu Asp Ala Ala Gin 

145 150 155 160 

Sa Ss f?» ^ C9C agg atC ggC tcg ggc cac gtg 528 

Ala His Gly Ala Arg Tyr Arg Gly Arg Arg He Gly Ser Gly His Val 

165 170 175 

Sal lit 11° I* 0 CCC ggC aSg aaC CtC ggC gcc atg 399 gac 576 

Val Ala Phe Ser Phe Tyr Pro Gly Lys Asn Leu Gly Ala Met Gly Asp 

180 185 190 

Giv Clt A? 3 .f? ^ S9t gaC tCC ggt gtg gcc gag egg ate egg 624 

Gly Gly Ala Val Val Thr Gly Asp Ser Gly Val Ala Glu Arg He Arg 

195 200 205 

rt g r Ctg ^ g ° tg ° 9gC tCS ° gg gag aag tac cgg ca c gag gtg cgc 672 

Leu Leu Arg Asn Cys Gly Ser Arg Glu Lys Tyr Arg His Glu Sal Arg 

210 215 220 

S ^ ^ C o C ° ° gg CtC gaC gag ttC cag gcg gcc gtg ctg egg gcc 720 
Ser Thr His Ser Arg Leu Asp Glu Phe Gin Ala Ala Val Leu Arg Ala 
44b 230 



235 240 

I"** T° t9 S C9 CtC 9aC gCg tgg aac gcc ^ egg gcc ggc acg gec 

Lys Leu Pro Arg Leu Asp Ala Trp Asn Ala Arg Arg Ala Gly Thr Ala 

245 250 255 

^ g £f C ?? 9 ° gg gC ° ° tg ggt ccg gta ccg cag a tc gcc gtc ccg 
Glu Arg Tyr Gly Arg Ala Leu Gly Pro Val Pro Gin He Ala Val Pro 
260 265 270 

Si ^ C ^ CCC tgg gCC 9aC CCg gtg tgg cac ctg tac 3tg ate cgc 
Val Thr Ala Pro Trp Ala Asp Pro Val Trp His Leu Tyr Sal He Arg 
275 280 285 

cSs SS SS S 9ag ctg cgc cgc cgg ctg gaa cga gcc ggg gtc 9i2 

oon 5 SP G1U Leu Ars Arg Arg Leu Glu Arg Ala Gly Val 

290 295 300 



c 39 a ^ T Ct ^ C ^ aC tac ccc gtg ccc c ^g cac egg tec ccg gcc tac 
Gin Thr Leu He His Tyr Pro Val Pro Pro His Arg Ser Pro Ala Tyr 

305 3 1 0 315 320 



768 



816 



864 



960 
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gcc gac gac ccg gcc ggc 
Ala Asp Asp Pro Ala Gly 
325 

cgc ctg gcg gcg cag age 
Arg Leu Ala Ala Gin Ser 
340 

gag gac gag gcc cgc gcc 
Glu Asp Glu Ala Arg Ala 
355 

ggg ctg gcg gcg tac ccg 
Gly Leu Ala Ala Tyr Pro 
370 

acg gag aaa cga tga 
Thr Glu Lys Arg 
385 



gca ccg gcg ggg acc cac 
Ala Pro Ala Gly Thr His 
330 

etc age ctt ccc ctg gga 
Leu Ser Leu Pro Leu Gly 
345 

gtc gtg gcg gcg gtc egg 
Val Val Ala Ala Val Arg 
360 

acg ccg gac ggc cag cgt 
Thr Pro Asp Gly Gin Arg 
375 380 



ccg etc agt gag 1008 
Pro Leu Ser Glu 
335 

ccg cac etc ggg 1056 
Pro His Leu Gly 
350 

gcg gcg tec gca 1104 

Ala Ala Ser Ala 

365 

ttt cct eta gtg 1152 
Phe Pro Leu Val 



1167 



<210> 29 
<211> 388 
<212> PRT 

<213> Streptomyces ambofaciens 
<400> 29 

Met Thr He Pro Phe Leu Asp Ala Gly Ala Gly Tyr Arg Glu Leu Arg 
1 5 10 ■ is 

Ala Glu He Asp Ala Ala Leu Gin Arg Val Ser Ala Ser Gly Arg Tyr 
20 25 30 

Leu Leu Asp Ala Glu Leu Ala Ala Phe Glu Glu Glu Phe Ala Ala Tyr 
3 5 4 0 45 

Cys Asp Asn Asp His Cys Val Ala Val Gly Ser Gly Cys Asp Ala Leu 
50 55 60 

Glu Leu Ser Leu Arg Ala Leu Asp He Gly Pro Gly Asp Glu Val Val 
65 70 75 80 

Val Pro Ala His Thr Phe He Gly Thr Trp Leu Ala Val Ser Ala Thr 
85 90 95 

Gly Ala Arg Pro Val Ala Val Asp Pro Thr Pro Asp Gly Leu Ser Leu 
100 105 110 

Asp Pro Ala Leu Val Glu Ala Ala Leu Thr Pro Arg Thr Arg Ala Leu 
115 120 125 

Met Pro Val His Leu His Gly His Pro Ala Asp Leu Asp Pro Leu Leu 
130 135 140 

Ala He Ala Gly Arg His Gly Leu Ala Val Val Glu Asp Ala Ala Gin 
145 150 155 ~ 160 

Ala His Gly Ala Arg Tyr Arg Gly Arg Arg He Gly Ser Gly His Val 
165 170 175 

Val Ala Phe Ser Phe Tyr Pro Gly Lys Asn Leu Gly Ala Met Gly Asp 
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!80 185 190 

Gly Gly Ala Val Val Thr Gly Asp Ser Gly Val Ala Glu Arg He Arg 
195 200 205 

Leu Leu Arg Asn Cys Gly Ser Arg Glu Lys Tyr Arg His Glu val Arg 
210 215 220 

• Ser Thr His. Ser. Arg -Leu Asp Glu Phe- Gin Ala Ala -Val Leu Arg Ala 
225 2 30 235 240 

Lys Leu Pro Arg Leu Asp Ala Trp Asn Ala Arg Arg Ala Gly Thr Ala 
245 250 255 

Glu Arg Tyr Gly Arg Ala Leu Gly Pro Val Pro Gin He Ala Val Pro 
2 <50 265 270 

Val Thr Ala Pro Trp Ala Asp Pro Val Trp His Leu Tyr Val He Arg 
275 280 285 

Cys Ala Glu Arg Asp Glu Leu Arg Arg Arg Leu Glu Arg Ala Gly Val 
290 295 300 

Gin Thr Leu He His Tyr Pro Val Pro Pro His Arg Ser Pro Ala Tyr 
305 310 315 320 

Ala Asp Asp Pro Ala Gly Ala Pro Ala Gly Thr His Pro Leu Ser Glu 
325 330 335 

Arg Leu Ala Ala Gin Ser Leu Ser Leu Pro Leu Gly Pro His Leu Gly 
340 345 350 

Glu Asp Glu Ala Arg Ala Val Val Ala Ala Val Arg Ala Ala Ser Ala 
355 360 365 

Gly Leu Ala Ala Tyr Pro Thr Pro Asp Gly Gin Arg Phe Pro Leu Val 
370 375 380 

Thr Glu Lys Arg 
3 85 



<210> 30 

<211> 909 

<212> ADN 

<213> Streptomyces ambof aciens 

<220> 

<221> CDS 

<222> (1) . . (909) 

<220> 

<221> CDS 

<222> (10) . . (909) 

<220> 

<221> CDS 

<222> (28) . . (909) 



<400> 30 
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atg acc gag gtc atg tea ggg cgt ccc gga atg aaa ggg ate ate etc 48 
Met Thr Glu Val Met Ser Gly Arg Pro Gly Met Lys Gly He He Leu 
15 10 15 

gca ggc ggc gga ggg acc cgc eta cgc ccc ttg acc ggc acg ctg tec 9 6 
Ala Gly Gly Gly Gly Thr Arg Leu Arg Pro Leu Thr Gly Thr Leu Ser 
20 25 30 

aag caa ctg ctg ccc gtc tac gac aag ccg atg ate tac tac ccg ctg 144 
Lys Gin Leu Leu Pro Val Tyr Asp Lys Pro Met He Tyr Tyr Pro Leu 
35 40 45 

tec gtc ctg atg ctg ggc ggc ate cgc gag ate etc gtc gtc tec tec 192 
Ser Val Leu Met Leu Gly Gly He Arg Glu He Leu Val Val Ser Ser 
50 55 60 

acc cag cac ate gag ctg ttc eag egg ctg ctg ggc gac ggc tec cgc" 240 
Thr Gin His He Glu Leu Phe Gin Arg Leu Leu Gly Asp Gly Ser Arg 
65 70 75 80 

etc ggc etc gac ate acc tac gec gaa cag gee gag ccc gag ggc ata 288 
Leu Gly Leu Asp He Thr Tyr Ala Glu Gin Ala Glu Pro Glu Gly He 
85 90 95 

gcg cag gee ate acc ate ggc acc gac cac ate ggc gac tea ccg gtc 33 6 
Ala Gin Ala He Thr He Gly Thr Asp His He Gly Asp Ser Pro Val 
100 105 110 

gcg etc ate ctg ggc gac aac ate ttc cac ggc ccc ggc ttc teg gee 384 
Ala Leu He Leu Gly Asp Asn He Phe His Gly Pro Gly Phe Ser Ala 
US 120 125 

gtg etc cag ggc age ate cgc cac etc gac ggc tgt gtg ctg ttc ggc 43 2 
Val Leu Gin Gly Ser He Arg His Leu Asp Gly Cys Val Leu Phe Gly 
"0 135 140 

tac ccg gtc age gac ccg aag cgc tac ggc gtc ggc gag ate gac gac 480 
Tyr Pro Val Ser Asp Pro Lys Arg Tyr Gly Val Gly Glu He Asp Asp 
145 150 155 ~ 160 

cag ggc gta ctg ctg tec ctg gag gag aaa ccg gee egg ccc cgc tec 52 8 
Gin Gly Val Leu Leu Ser Leu Glu Glu Lys Pro Ala Arg Pro Arg Ser 
1^5 170 175 

aac etc gee gtc acc ggc etc tac etc tac gac aac gac gtg gte gac 576 
Asn Leu Ala Val Thr Gly Leu Tyr Leu Tyr Asp Asn Asp Val Val Asp 
180 185 190 

ate gee aag aac ate egg ccc teg gcg cgc ggc gaa etc gag ate acg 62 4 
He Ala Lys Asn He Arg Pro Ser Ala Arg Gly Glu Leu Glu He Thr 
195 200 205 

gac gtc aac agg acc tac ctg gag cag aaa cgc gee egg etc ate gaa 672 
Asp Val Asn Arg Thr Tyr Leu Glu Gin Lys Arg Ala Arg Leu lie Glu 
210 215 220 

ctg ggc cac ggc ttc gee tgg etc gac atg ggc acc cac gac tec etc 72 0 
Leu Gly His Gly Phe Ala Trp Leu Asp Met Gly Thr His Asp Ser Leu 
225 230 235 240 



etc cag ggc ggc cag tac gtc cag etc ate gag cag cgc cag gga gtg 



768 
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Leu Gin Gly Gly Gin Tyr Val Gin Leu He Glu Gin Arg Gin Gly Val 
245 250 255 

egg ate gee tgc ate gag gag ate gee ctg cgc atg ggc ttc ate gac 816 
Arg He Ala Cys He Glu Glu He Ala Leu Arg Met Gly Phe He Asp 
260 265 270 

gee gac acc etc cac egg etc ggc cgc gaa ctg ggc acc tec gga tac 864 

Ala Asp Thr Leu. His . Arg. Leu Gly. Arg. Glu. Leu -Gly Thr -Ser. Gly Tyr 

275 2 80 2 85 

ggc gcg tac ctg atg gag gtg gee acc cgt gca ggc acc gaa tga 909 
Gly Ala Tyr Leu Met Glu Val Ala Thr Arg Ala Gly Thr Glu 
290 295 300 



<210> 31 
<211> 302 
<212> PRT 

<213> Streptomyces ambofaciens 
<400> 31 

Met Thr Glu Val Met Ser Gly Arg Pro Gly Met Lys Gly He He Leu 
15 10 15 

Ala Gly Gly Gly Gly Thr Arg Leu Arg Pro Leu Thr Gly Thr Leu Ser 
20 25 30 

Lys Gin Leu Leu Pro Val Tyr Asp Lys Pro Met He Tyr Tyr Pro Leu 
35 40 45 

Ser Val Leu Met Leu Gly Gly He Arg Glu He Leu Val Val Ser Ser 
50 55 60 

Thr Gin His He Glu Leu Phe Gin Arg Leu Leu Gly Asp Gly Ser Arg 
65 70 75 80 

Leu Gly Leu Asp He Thr Tyr Ala Glu Gin Ala Glu Pro Glu Gly He 
85 90 95 

Ala Gin Ala He Thr He Gly Thr Asp His He Gly Asp Ser Pro Val 
100 105 110 

Ala Leu He Leu Gly Asp Asn He Phe His Gly Pro Gly Phe Ser Ala 
115 120 125 

Val Leu Gin Gly Ser He Arg His Leu Asp Gly Cys Val Leu Phe Gly 
130 135 140 

Tyr Pro Val Ser Asp Pro Lys Arg Tyr Gly Val Gly Glu He Asp Asp 
145 150 155 160 

Gin Gly Val Leu Leu Ser Leu Glu Glu Lys Pro Ala Arg Pro Arg Ser 
165 170 175 

Asn Leu Ala Val Thr Gly Leu Tyr Leu Tyr Asp Asn Asp Val Val Asp 
180 185 190 

He Ala Lys Asn He Arg Pro Ser Ala Arg Gly Glu Leu Glu He Thr 
195 200 205 
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Asp Val Asn Arg Thr Tyr Leu Glu Gin Lys Arg Ala Arg Leu lie Glu 
210 215 220 

Leu Gly His Gly Phe Ala Trp Leu Asp Met Gly Thr His Asp Ser Leu 
225 230 235 240 

Leu Gin Gly Gly Gin Tyr Val Gin Leu He Glu Gin Arg Gin Gly Val 
245 250 255 

Arg He Ala Cys He Glu Glu He Ala Leu Arg Met Gly Phe lie Asp 
260 265 270 

Ala Asp Thr Leu His Arg Leu Gly Arg Glu Leu Gly Thr Ser Gly Tyr 
275 280 285 

Gly Ala Tyr Leu Met Glu Val Ala Thr Arg Ala Gly Thr Glu 
290 295 300 



<210> 32 
<211> 299 
<212> PRT 

<213> Streptomyces ambof aciens 
<400> 32 

Val Met Ser Gly Arg Pro Gly Met Lys Gly He He Leu Ala Gly Gly 
15 10 15 

Gly Gly Thr Arg Leu Arg Pro Leu Thr Gly Thr Leu Ser Lys Gin Leu 
20 25 30 

Leu Pro Val Tyr Asp Lys Pro Met He Tyr Tyr Pro Leu Ser Val Leu 
35 .40 45 

• Met Leu Gly Gly He Arg Glu He Leu Val Val Ser Ser Thr Gin His 
50 55 60 

He Glu Leu Phe Gin Arg Leu Leu Gly Asp Gly Ser Arg Leu Gly Leu 
65 70 75 80 

Asp He Thr Tyr Ala Glu Gin Ala Glu Pro Glu Gly He Ala Gin Ala 
85 90 95 

He Thr He Gly Thr Asp His He Gly Asp Ser Pro Val Ala Leu He 
100 105 110 

Leu Gly Asp Asn lie Phe His Gly Pro Gly Phe Ser Ala Val Leu Gin 
115 120 125 

Gly Ser He Arg His Leu Asp Gly Cys Val Leu Phe Gly Tyr Pro Val 
130 135 140 

Ser Asp Pro Lys Arg Tyr Gly Val Gly Glu He Asp Asp Gin Gly Val 
145 150 155 160 

Leu Leu Ser Leu Glu Glu Lys Pro Ala Arg Pro Arg Ser Asn Leu Ala 
165 170 175 

Val Thr Gly Leu Tyr Leu Tyr Asp Asn Asp Val Val Asp He Ala Lys 
180 185 190 
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Asn lie Arg Pro Ser Ala Arg Gly Glu Leu Glu lie Thr Asp Val Asn 

195 200 205 

Arg Thr Tyr Leu Glu Gin Lys Arg Ala Arg Leu He Glu Leu Gly His 

210 215 220 

Gly Phe Ala Trp Leu Asp Met Gly Thr His Asp Ser Leu Leu Gin Gly 

225 230 235 240 



Gly Gin Tyr Val Gin Leu He Glu Gin Arg Gin Gly Val Arg He Ala 
245 250 255 

Cys He Glu Glu He Ala Leu Arg Met Gly Phe He Asp Ala Asp Thr 
260 265 270 

Leu His Arg Leu Gly Arg Glu Leu Gly Thr Ser Gly Tyr Gly Ala Tyr 
275 280 ' 285 

Leu Met Glu Val Ala Thr Arg Ala Gly Thr Glu 
290 295 



<210> 33 
<211> 293 
<212> PRT 

<213> Streptomyces ambofaciens 
<400> 33 

Gly Met Lys Gly He He Leu Ala Gly Gly Gly Gly Thr Arg Leu Arg 
15 10 15 

Pro Leu Thr Gly Thr Leu Ser Lys Gin Leu Leu Pro Val Tyr Asp Lys 
20 25 30 

Pro Met He Tyr Tyr Pro Leu Ser Val Leu Met Leu Gly Gly He Arg 
35 40 45 

Glu He Leu Val Val Ser Ser Thr Gin His He Glu Leu Phe Gin Arg 
50 55 60 

Leu Leu Gly Asp Gly Ser Arg Leu Gly Leu Asp He Thr Tyr Ala Glu 
65 70 75 80 

Gin Ala Glu Pro Glu Gly He Ala Gin Ala He Thr He Gly Thr Asp 
85 90 95 

His lie Gly Asp Ser Pro Val Ala Leu He Leu Gly Asp Asn He Phe 
100 105 110 

His Gly Pro Gly Phe Ser Ala Val Leu Gin Gly Ser He Arg His Leu 
115 120 125 

Asp Gly Cys Val Leu Phe Gly Tyr Pro Val Ser Asp Pro Lys Arg Tyr 
13 0 135 140 

Gly Val Gly Glu He Asp Asp Gin Gly Val Leu Leu Ser Leu Glu Glu 
145 150 155 160 

Lys Pro Ala Arg Pro Arg Ser Asn Leu Ala Val Thr Gly Leu Tyr Leu 
165 170 175 
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Tyr Asp Asn Asp Val Val Asp He 
180 

Arg Gly Glu Leu Glu He Thr Asp 
195 200 

Lys Arg Ala Arg Leu He Glu Leu 
210 215 

Met Gly Thr His Asp Ser Leu Leu 
225 230 

He Glu Gin Arg Gin Gly Val Arg 
245 

Leu Arg Met Gly Phe He Asp Ala 
260 

Glu Leu Gly Thr Ser Gly Tyr Gly 
275 280 

Arg Ala Gly Thr Glu 
290 



Ala Lys Asn He Arg Pro Ser Ala 
185 190 

Val Asn Arg Thr Tyr Leu Glu Gin 
205 

Gly His Gly Phe Ala Trp Leu Asp 

220 

Gin Gly Gly Gin Tyr Val Gin Leu 

235 240 

He Ala Cys He Glu Glu He Ala 
250 255 

Asp Thr Leu His Arg Leu Gly Arg 
265 270 

Ala Tyr Leu Met Glu Val Ala Thr 
2 85 



<210> 34 

<211> 1038 

<212> ADN 

<213> Streptomyces ambof aciens 

<220> 

<22'1> CDS 

<222> (1) . . (1038) 

<400> 34 

gtg cag gca ccg aat gag acg ccg cgc egg ccc gec cgc tec gec ggc 48 

Val Gin Ala Pro Asn Glu Thr Pro Arg Arg Pro Ala Arg Ser Ala Gly 

1 5 10 15 

cga egg ccg ccg gee egg ate etc gtc ace ggg ggc gee ggc ttc ate 96 
Arg Arg Pro Pro Ala Arg He Leu Val Thr Gly Gly Ala Gly Phe He 
20 25 ~ 30 

ggc teg cgc ttc gtg aac gcg ctg ctg gac ggc tec ctg ccg gag ttc 144 
Gly Ser Arg Phe Val Asn Ala Leu Leu Asp Gly Ser Leu Pro Glu Phe 
35 40 45 

ggc aaa ccc gag gtg agg gtg etc gac gcg etc acc tac gcg ggc aac 192 
Gly Lys Pro Glu Val Arg Val Leu Asp Ala Leu Thr Tyr Ala Gly Asn 
50 55 60 

ctg gee aat ctg gee ccg gtg ggc gac tgt ccc egg ctg egg ate ttc 240 
Leu Ala Asn Leu Ala Pro Val Gly Asp Cys Pro Arg Leu Arg He Phe 
65 70 75 80 

ccg ggg gac ate cgc gac cgc ggc gcg gtc acc cag gcg atg gcg ggg 288 
Pro Gly Asp He Arg Asp Arg Gly Ala Val Thr Gin Ala Met Ala Gly 
85 90 95 



gtc gac ctg gtg gtg cac ttc gcg gee gag teg cac gtg gac cgc teg 33 6 
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Val Asp Leu Val Val His Phe Ala Ala Glu Ser His Val Asp Arg Ser 
100 105 110 

ate gac gac gec gac gec ttc gtg cgc acc aac gtg ctg ggc acc cag 3 84 
lie Asp Asp Ala Asp Ala Phe Val Arg Thr Asn Val Leu Gly Thr Gin 
115 120 125 

gtc etc etc cag gag gca ctg gec gta cgc ccc ggg ctg ttc gtg cac 432 

Val Leu Leu Gin Glu Ala Leu Ala Val_Arg Pro Gly Leu _Phe Val_ His 

130 135 140 

gtc teg acg gac gag gtg tac ggc tec ate gag gag ggg tec tgg ccc 480 
Val Ser Thr Asp Glu Val Tyr Gly Ser lie Glu Glu Gly Ser Trp Pro 
145 150 155 160 

gag gag cac ccg ctg aac ccc aac teg ccc tac gec gee teg aag gcg 52 8 
Glu Glu His Pro Leu Asn Pro Asn Ser Pro Tyr Ala Ala Ser Lys Ala 
165 170 175 

tec tec gac ctg ctg gcg ctg gec cac cac cgc acg cac gga ctg ccg 576 
Ser Ser Asp Leu Leu Ala Leu Ala His His Arg Thr His Gly Leu Pro 
180 185 190 

gtg tgc gtc acc cgc tgc tec aac aac tac ggg ccc tac cag tac ccg 624 
Val Cys Val Thr Arg Cys Ser Asn Asn Tyr Gly Pro Tyr Gin Tyr Pro 
195 200 205 

gag aag ate ate ccg ctg ttc acc age age etc etc gac ggc ggg. acc 672 
Glu Lys lie lie Pro Leu Phe Thr Ser Ser Leu Leu Asp Gly Gly Thr 
210 215 220 

gtc ccg etc tac ggg gac ggc ggc aac egg cgc gac tgg ctg cac gtg 72 0 
Val Pro Leu Tyr Gly Asp Gly Gly Asn Arg Arg Asp Trp Leu His Val 
225 230 235 240 

gac gac cac tgc egg ggc ate gee ctg gtg gee egg ggc ggc egg ccc 768 
Asp Asp His Cys Arg Gly lie Ala Leu Val Ala Arg Gly Gly Arg Pro 
245 250 y 255 

ggc gag gtc tac aac ate ggc ggc ggc acc gag ctg age aac gtc gag 816 
Gly Glu Val. Tyr Asn lie Gly Gly Gly Thr Glu Leu Ser Asn Val Glu 
260 265 270 

etc acg gag cgt ctg ctg aaa ctg tgc gga gee gac tgg teg gcg gtg 864 
Leu Thr Glu Arg Leu Leu Lys Leu Cys Gly Ala Asp Trp Ser Ala Val 
275 280 285 

egg egg gtg ccc gac cgc aag ggc cac gac egg cgc tac tee gtc gac 912 
Arg Arg Val Pro Asp Arg Lys Gly His Asp Arg Arg Tyr Ser Val Asp 
290 295 300 

tac acc aag ate gcg gac gag ctg ggt tac gcg ccg egg ate acc ate 960 
Tyr Thr Lys lie Ala Asp Glu Leu Gly Tyr Ala Pro Arg lie Thr He 
305 310 315 320 

gac gaa ggg ctg gag egg acc gtg cac tgg tac egg gag aac cgc gcg 1008 
Asp Glu Gly Leu Glu Arg Thr Val His Trp Tyr Arg Glu Asn Arg Ala 
325 330 335 



tgg tgg gcg ccc gcg aag agg ggg cga tga 
Trp Trp Ala Pro Ala Lys Arg Gly Arg 



1038 
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340 345 



<210> 35 
<211> 345 
<212> PRT 

<213> Streptomyces ambofaciens 
<400> 35 

Val Gin Ala Pro Asn Glu Thr Pro Arg Arg Pro Ala Arg Ser Ala Gly 
15 10 15 

Arg Arg Pro Pro Ala Arg He Leu Val Thr Gly Gly Ala Gly Phe He 
20 25 30 

Gly Ser Arg Phe Val Asn Ala Leu Leu Asp Gly Ser Leu Pro Glu Phe 
35 40 45 

Gly Lys Pro Glu Val Arg Val Leu Asp Ala Leu Thr Tyr Ala Gly Asn 
50 55 60 

Leu Ala Asn Leu Ala Pro Val Gly Asp Cys Pro Arg Leu Arg He Phe 
65 70 75 80 

Pro Gly Asp He Arg Asp Arg Gly Ala Val Thr Gin Ala Met Ala Gly 
85 90 95 

Val Asp Leu Val Val His Phe Ala Ala Glu Ser His Val Asp Arg Ser 
100 105 HO 

He Asp Asp Ala Asp Ala Phe Val Arg Thr Asn Val Leu Gly Thr Gin 
115 120 125 

Val Leu Leu Gin Glu Ala Leu Ala Val Arg Pro Gly Leu Phe Val His 
130 135 140 

Val Ser Thr Asp Glu Val Tyr Gly Ser He Glu Glu Gly Ser Trp Pro 
145 150 155 160 

Glu Glu His Pro Leu Asn Pro Asn Ser Pro Tyr Ala Ala Ser Lys Ala 
165 170 175 

Ser Ser Asp Leu Leu Ala Leu Ala His His Arg Thr His Gly Leu Pro 
180 185 190 

Val Cys Val Thr Arg Cys Ser Asn Asn Tyr Gly Pro Tyr Gin Tyr Pro 
195 200 205 

Glu Lys He He Pro Leu Phe Thr Ser Ser Leu Leu Asp Gly Gly Thr 
210 215 220 

Val Pro Leu Tyr Gly Asp Gly Gly Asn Arg Arg Asp Trp Leu His Val 
225 230 235 . 240 

Asp Asp His Cys Arg Gly He Ala Leu Val Ala Arg Gly Gly Arg Pro 
245 250 255 

Gly Glu Val Tyr Asn He Gly Gly Gly Thr Glu Leu Ser Asn Val Glu 
260 265 270 

Leu Thr Glu Arg Leu Leu Lys Leu Cys Gly Ala Asp Trp Ser Ala Val 
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275 280 285 

Arg Arg Val Pro Asp Arg Lys Gly His Asp Arg Arg Tvr Ser Val Asp 
290 295 300 

Tyr Thr Lys lie Ala Asp Glu Leu Gly Tyr Ala Pro Arg lie Thr He 
305 310 315 320 

Asp Glu Gly Leu Glu Arg Thr_ Val His Trp Tyr Arg Glu Asn Arg Ala 
325 330 335 

Trp Trp Ala Pro Ala Lys Arg Gly Arg 
340 345 



<210> 36 
<211> 804 
<212> AD2SF 

<213> Streptomyces ambofaciens 

<220> 

<221> CDS 

<222> (1) . . (804) 

<220> 

<221> CDS 

<222> (7) . . (804) 

<220> 

<221> CDS 

<222> (22) . . (804) 

<400> 36 

atg acg gtg acg acc gca tec gtg gac ccg etc gac ctg tgg etc cgc 48 

Met Thr Val Thr Thr Ala Ser Val Asp Pro Leu Asp Leu Trp Leu Arg 
1 5 10 15 

egg tac cag ccg tec gcg tea ccc gee gtc egg ctg gtg tgc ttc ccg 96 
Arg Tyr Gin Pro Ser Ala Ser Pro Ala Val Arg Leu Val Cys Phe Pro 
20 25 30 

cac gcg ggc ggc teg gcg agt teg ttc ctg ccg ttc acc egg cag ctg 14 4 
His Ala Gly Gly Ser Ala Ser Ser Phe Leu Pro Phe Thr Arg Gin Leu 
35 40 45 

ccg gac egg ate gag gtc gtg gee gtc cag tac ccc ggg cgc cag gac 192 
Pro Asp Arg He Glu Val Val Ala Val Gin Tyr Pro Gly Arg Gin Asp 
50 55 60 

cgc agg age gaa ccg ctg gtc gac acc ate gag gga ctg gee gag ccc 240 
Arg Arg Ser Glu Pro Leu Val Asp Thr He Glu Gly Leu Ala Glu Pro 
65 70 75 80 

ctg gec ggc ctg ctg gag gcg cag gee ggc ccc ccg gtg gtg ctg ttc 2 88 
Leu Ala Gly Leu Leu Glu Ala Gin Ala Gly Pro Pro Val Val Leu Phe 
85 90 95 

ggg cac age atg ggc gcg ctg gtg gee tac gag gtc gec cgc gcg etc 33 6 
Gly His Ser Met Gly Ala Leu Val Ala Tyr Glu Val Ala Arg Ala Leu 
100 105 110 
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cag egg egg gga gcg get ccg gtg cgc ctg gtg gtc tec ggg cgc egg 3 84 
Gin Arg Arg Gly Ala Ala Pro Val Arg Leu Val Val Ser Gly Arg Arg 
115 120 125 

gee ccc gec gtc gac egg ccg atg acc gtg cac etc tac gac gac gac 432 
Ala Pro Ala Val Asp Arg Pro Met Thr Val His Leu Tyr Asp Asp Asp 
130 135 140 



egg ctg gtc gag gaa etc cgc aag etc gac ggc acc gac age cag gtg 
Arg Leu Val Glu Glu Leu Arg Lys Leu Asp Gly Thr Asp Ser Gin Val 
145 150 155 160 



ttc gec gat ccg gag ctg etc egg ctg gtg ctg ccc gtg ate cgc aac 
Phe Ala Asp Pro Glu Leu Leu Arg Leu Val Leu Pro Val lie Arg Asn 
165 170 175 



gac tgc ccc etc acc gtg ttc acc ggc gee gac gac ccc acc gtg acc 
Asp Cys Pro Leu Thr Val Phe Thr Gly Ala Asp Asp Pro Thr Val Thr 
195 200 205 



528 



gac tac egg gec gtg gcg gee tac gee cac cgc ccg ggg gcg ccg ctg 57 6 
Asp Tyr Arg Ala Val Ala Ala Tyr Ala His Arg Pro Gly Ala Pro Leu 
180 185 190 



624 



gcg gee gag gcg gcg gec 
Ala Ala Glu Ala Ala Ala 
210 



tgg cac gag gcg gcg 
Trp His Glu Ala Ala 
215 



gcg tec gac gtc gag 672 

Ala Ser Asp Val Glu 

220 



acg cgc acc ttc ccc ggt ggc cac 
Thr Arg Thr Phe Pro Gly Gly His 
225 230 

gag gtg tgc ggg gee ctg gtc gac 
Glu Val Cys Gly Ala Leu Val Asp 
245 



ttc ttc ccg tac cag egg acc gcg 72 0 
Phe Phe Pro Tyr Gin Arg Thr Ala 
235 240 

acg etc gag ccg ctg ctg teg gec 768 
Thr Leu Glu Pro Leu Leu Ser Ala 
250 255 



ggg acg cgc ggt gtc egg egg gtc cgc ccg ggg tga 804 
Gly Thr Arg Gly Val Arg Arg Val Arg Pro Gly 
260 265 



<210> 37 
<211> 267 
<212> PRT 

<213> Streptomyces ambofaciens 
<400> 37 

Met Thr Val Thr Thr Ala Ser Val 
1 5 

Arg Tyr Gin Pro Ser Ala Ser Pro 
20 

His Ala Gly Gly Ser Ala Ser Ser 

35 40 

Pro Asp Arg lie Glu Val Val Ala 
50 55 

Arg Arg Ser Glu Pro Leu Val Asp 



Asp Pro Leu Asp Leu Trp Leu Arg 
10 15 

Ala Val Arg Leu Val Cys Phe Pro 
25 30 

Phe Leu Pro Phe Thr Arg Gin Leu 
45 

Val Gin Tyr Pro Gly Arg Gin Asp 
60 

Thr lie Glu Gly Leu Ala Glu Pro 
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65 7 0 



75 80 



Leu Ala Gly Leu Leu Glu Ala Gin Ala Gly Pro Pro Val Val Leu Phe 
85 90 95 

Gly His Ser Met Gly Ala Leu Val Ala Tyr Glu val Ala Arg Ala Leu 
100 105 HO 

„ Gin A rg Arg Gly Ala Ala Pro Val- Arg- Leu- Val- Val Ser Gly Arg A>-g 
115 120 125 

Ala Pro Ala Val Asp Arg Pro Met Thr Val His Leu Tyr Asp Asp Asp 
130 135 140 

Arg Leu Val Glu Glu Leu Arg Lys Leu Asp Gly Thr Asp Ser Gin Val 
145 150 155 160 

Phe Ala Asp Pro Glu Leu Leu Arg Leu Val Leu Pro Val He Arg Asn 
I 65 170 175 

Asp Tyr Arg Ala Val Ala Ala Tyr Ala His Arg Pro Gly Ala Pro Leu 
180 185 190 

Asp Cys Pro Leu Thr Val Phe Thr Gly Ala Asp Asp Pro Thr Val Thr 
195 200 205 

Ala Ala Glu Ala Ala Ala Trp His Glu Ala Ala Ala Ser Asp Val Glu 
210 215 22Q 

Thr Arg Thr Phe Pro Gly Gly His Phe Phe Pro Tyr Gin Arg Thr Ala 
225 230 235 240 

Glu Val Cys Gly Ala Leu Val Asp Thr Leu Glu Pro Leu Leu Ser Ala 
245 250 255 

Gly Thr Arg Gly Val Arg Arg Val Arg Pro Gly 
260 265 

<210> 38 
<211> 265 
<212> PRT 

<213> Streptomyces ambof aciens 
<400> 38 

Val Thr Thr Ala Ser Val Asp Pro Leu Asp Leu Trp Leu Arg Arg Tyr 
1 5 10 15 

Gin Pro Ser Ala Ser Pro Ala Val Arg Leu Val Cys Phe Pro His Ala 
20 25 30 

Gly Gly Ser Ala Ser Ser Phe Leu Pro Phe Thr Arg Gin Leu Pro Asp 
35 40 45 

Arg lie Glu Val Val Ala Val Gin Tyr Pro Gly Arg Gin Asp Arg Arg 
b0 55 60 



Ser Glu Pro Leu Val Asp Thr He Glu Gly Leu Ala Glu Pro Leu Ala 
65 70 75 80 

Gly Leu Leu Glu Ala Gin Ala Gly Pro Pro Val Val Leu Phe Gly His 
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85 90 95 

Ser Met Gly Ala Leu Val Ala Tyx Glu Val Ala Arg Ala Leu Gin Arg 
100 105 110 

Arg Gly Ala Ala Pro Val Arg Leu Val Val Ser Gly Arg Arg Ala Pro 
115 120 125 

Ala Val Asp Arg Pro Met Thr Val His Leu Tyr Asp Asp Asp Arg Leu 
130 135 140 

Val Glu Glu Leu Arg Lys Leu Asp Gly Thr Asp Ser Gin Val Phe Ala 
145 150 155 160 

Asp Pro Glu Leu Leu Arg Leu Val Leu Pro Val He Arg Asn Asp Tyr 
165 170 175 

Arg Ala Val Ala Ala Tvr Ala His Arg Pro Gly Ala Pro Leu Asp Cys 
180 185 190 

Pro Leu Thr Val Phe Thr Gly Ala Asp Asp Pro Thr Val Thr Ala Ala 
195 200 205 

Glu Ala Ala Ala Trp His Glu Ala Ala Ala Ser Asp Val Glu Thr Arg 
210 215 220 

Thr Phe Pro Gly Gly His Phe Phe Pro Tyr Gin Arg Thr Ala Glu Val 
225 ~ 230- 235 240 

Cys Gly A La Leu Val Asp Thr Leu Glu Pro Leu Leu Ser Ala Gly Thr 
245 250 255 

Arg Gly Val Arg Arg Val Arg Pro Gly 
260 265 



<210> 39 
<211> 260 
<212> PRT 

<213> Streptomyces ambofaciens 
<400> 39 

Val Asp Pro Leu Asp Leu Trp Leu Arg Arg Tyr Gin Pro Ser Ala Ser 
15 10 15 

p-ro Ala Val Arg Leu Val Cys Phe Pro His Ala Gly Gly Ser Ala Ser 
20 25 30 

Ser Phe Leu Pro Phe Thr Arg Gin Leu Pro Asp Arg He Glu Val Val 
35 40 45 

Ala Val Gin Tyr Pro Gly Arg Gin Asp Arg Arg Ser Glu Pro Leu Val 
50 55 60 

Asp Thr He Glu Gly Leu Ala Glu Pro Leu Ala Gly Leu Leu Glu Ala 
65 70 75 80 

Gin Ala Gly Pro Pro Val Val Leu Phe Gly His Ser Met Gly Ala Leu 
85 90 95 

Val Ala Tyr Glu Val Ala Arg Ala Leu Gin Arg Arg Gly Ala Ala Pro 
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100 105 110 

Val Arg Leu Val Val Ser Gly Arg Arg Ala Pro Ala Val Asp Arg Pro 
H5 120 125 

- — a. y j_ rto^y ritiy Aiy Leu vax <^±u u±u Leu Arg 

130 135 140 

_Lys_Leu_Asp„_G^ 

145 150 155 160 

Arg Leu Val Leu Pro Val lie Arg Asn Asp Tyr Arg Ala Val Ala Ala 
165 170 175 

Tyr Ala His Arg Pro Gly Ala Pro Leu Asp Cys Pro Leu Thr Val Phe 
180 185 190 

Thr Gly Ala Asp Asp Pro Thr Val Thr Ala Ala Glu Ala Ala Ala Trp 
195 200 205 

His Glu Ala Ala Ala Ser Asp Val Glu Thr Arg Thr Phe Pro Gly Gly 
210 215 220 

His Phe Phe Pro Tyr Gin Arg Thr Ala Glu Val Cys Gly Ala Leu Val 
225 230 235 240 

Asp Thr Leu Glu Pro Leu Leu Ser Ala Gly Thr Arg Gly Val Arg Arg 
24 5 250 255 

Val Arg Pro Gly 
260 



<210> 40 
<211> 1410 
<212> ADN 

<213> Streptomyces ambofaciens 

<220> 

<221> CDS 

<222> (1) . . (1410) 

<220> 

<221> CDS 

<222> (46) . . (1410) 

<400> 40 

gtg ggc acg gtc gag tac gcc gtc cac 

Val Gly Thr Val Glu Tyr Ala Val His 

1 5 

agg gtc tec gcc gac acc ctg gac age 
Arg Val Ser Ala Asp Thr Leu Asp Ser 
20 25 

gtg ccc cgc tgg ctg gag gaa tac cac 
Val Pro Arg Trp Leu Glu Glu Tyr His 
35 40 



egg cgt acc gcg gaa egg gtg 4 8 
Arg Arg Thr Ala Glu Arg Val 
10 15 

ccg gtc acc gcg ctg gcg gag 9 6 
Pro Val Thr Ala Leu Ala Glu 
30 

egg gcg cac cgc ttc cac gtc 144 
Arg Ala His Arg Phe His Val 
45 



gag ccg ate ccc ttc gac egg etc egg egg tgg tec ttc gag ccg ggc 192 



1er depot 



60 



Glu Pro lie Pro Phe Asp Arg Leu Arg Arg Trp Ser Phe Glu Pro Gly 
50 55 60 

acc ggc gac ctg egg cac gag acg ggc cgc ttc ttc tec gtg gag ggg 240 
Thr Gly Asp Leu Arg His Glu Thr Gly Arg Phe Phe Ser Val Glu Gly 
65 70 75 80 

ctg cgc acc age teg gac gee gat ccg gtc gee cgt gtc cag ccg ate 2 88 
Leu Arg Thr Ser Ser Asp Ala Asp Pro Val Ala Arg Val Gin Pro lie 
85 90 95 

ate gtg cag ccc gag gtg ggg ctg etc ggc ate ctg gee egg gag ttc 33 6 
lie Val Gin Pro Glu Val Gly Leu Leu Gly lie Leu Ala Arg Glu Phe 
100 105 110 

gac ggg gtg ctg cac ttc ctg atg cag gee aaa ccc gag ccc ggc aac 384 
Asp Gly Val Leu His Phe Leu Met Gin Ala Lys Pro Glu Pro Gly Asn. 
115 120 125 

gtc aac ggg ctg cag ate tec ccc acg gtg cag gec acg cgc age aac 432 
Val Asn Gly Leu Gin lie Ser Pro Thr Val Gin Ala Thr Arg Ser Asn 
130 135 140 

ttc gac gag gtg cac cac ggc egg tec acc ccg ttc etc gac cac ttc 480 
Phe Asp Glu Val His His Gly Arg Ser Thr Pro Phe Leu Asp His Phe 
145 150 155 160 

ate cac cgc ccc ggc cgc egg gtc ctg ate gac age ate cag tec gaa 52 8 
lie His Arg Pro Gly Arg Arg Val Leu lie Asp Ser lie Gin Ser Glu 
165 170 175 

cag ggc gac tgg ttc ctg cac aag cgc aac cgc aac atg gtc gtc gag 57 6 
Gin Gly Asp Trp Phe Leu His Lys Arg Asn Arg Asn Met Val Val Glu 
180 185 190 

ate gac acc gac ate gag gee gac gee gcg ttc cgc tgg ctg acc etc 624 
lie Asp Thr Asp lie Glu Ala Asp Ala Ala Phe Arg Trp Leu Thr Leu 
195 200 205 

ggg cag ate cgc egg ctg atg etc cag gac gac etc gtc aac atg gac 672 
Gly Gin lie Arg Arg Leu Met Leu Gin Asp Asp Leu Val Asn Met Asp 
210 215 220 

acc cgc agt gtg ctg gec tgt ctg ccc acc gcg cac ggc acg ccc gac 720 
Thr Arg Ser Val Leu Ala Cys Leu Pro Thr Ala His Gly Thr Pro Asp 
225 230 235 240 

gac ggt gac gac tec ttc ccg gcg gcg ctg cgc cgc tec etc tac ggg 7 68 
Asp Gly Asp Asp Ser Phe Pro Ala Ala Leu Arg Arg Ser Leu Tyr Gly 
245 250 255 

gag acc gcg ccg ttg cac gat ctg cac gee ate acc age tgc etc acc 816 
Glu Thr Ala Pro Leu His Asp Leu His Ala lie Thr Ser Cys Leu Thr 
260 265 270 

gac gtc egg gcg ctg egg gtg ctg cgc cag cag age gtg ccg etc gac 864 
Asp Val Arg Ala Leu Arg Val Leu Arg Gin Gin Ser Val Pro Leu Asp 
275 280 285 



gac gec egg egg gac ggc tgg gag egg acc ggg age gcg ate egg cat 
Asp Ala Arg Arg Asp Gly Trp Glu Arg Thr Gly Ser Ala lie Arg His 



912 
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290 295 300 

cgc age ggc agg cat ttc gag ate atg gcg gtg gag gtg acc gcg gag 960 

Arg Ser Gly Arg His Phe Glu lie Met Ala Val Glu Val Thr Ala Glu 
305 310 315 320 

cgc cgt gaa gtg gec teg tgg acc cag ccg ttg ctg cgc ccg tgc teg 1008 
Arg Arg Glu Val Ala Ser Trp Thr Gin Pro Leu Leu Arg Pro Cys Ser 
325_ 33.0 335 



cag gga ctg gcg gee ctg ate acc egg egg ate aac ggg gtg ctg ; cac 1056 
Gin Gly Leu Ala Ala Leu lie Thr Arg Arg lie Asn Gly Val Leu His 
340 345 350 

gec ctg gtg gcg gcg egg teg gag gtc ggc acg etc aac gtc gec gag 1104 
Ala Leu Val Ala Ala Arg Ser Glu Val Gly Thr Leu Asn Val Ala Glu 
355 360 365 

ttc gga ccg acc gtc cag tgc egg ccc gac gag gcg gac ggc cag teg 1152 
Phe Gly Pro Thr Val Gin Cys Arg Pro Asp Glu Ala Asp Gly Gin Ser 
370 375 380 

ccc ccg tac ctg gac egg gtg ctg acg gee gga gec gac cgc gtc cgc 1200 
Pro Pro Tyr Leu Asp Arg Val Leu Thr Ala Gly Ala Asp Arg Val Arg 
385 390 395 400 

tac gac gtg gtg cag teg gag gag ggc ggg cgc ttc tac cac gcg cgc 1248 
Tyr Asp Val Val Gin Ser Glu Glu Gly Gly Arg Phe Tyr His Ala Arg 
405 410 415 

aac cgc tat ctg gtg gtc gag gcg ggg ccg gag etc gac acg ggc tgc 12 96 
Asn Arg Tyr Leu Val Val Glu Ala Gly Pro Glu Leu Asp Thr Gly Cys 
420 425 43 0 

ccg ccc ggc ttc tgc tgg get acc ttc ggc cag etc acc gaa ctg etc 1344 
Pro Pro Gly Phe Cys Trp Ala Thr Phe Gly Gin Leu Thr Glu Leu Leu 
435 440 445 

gcg cac ggc aac tat etc aac gtc gaa etc cgc acc etc atg gcg tgc 13 92 
Ala His Gly Asn Tyr Leu Asn Val Glu Leu Arg Thr Leu Met Ala Cys 
450 455 460 

gca cac gee tec tac tga 1410 
Ala His Ala Ser Tyr 
465 470 



<210> 41 

<211> 469 

<212> PRT 

<213> Streptomyces ambofaciens 

<400> 41 

Val Gly Thr Val Glu Tyr Ala Val 
1 5 

Arg Val Ser Ala Asp Thr Leu Asp 
2 0 

Val Pro Arg Trp Leu Glu Glu Tyr 
35 40 



His Arg Arg Thr Ala Glu Arg Val 
10 15 

Ser Pro Val Thr Ala Leu Ala Glu 
25 30 

His Arg Ala His Arg Phe His Val 
45 
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Glu Pro lie Pro Phe Asp Arg Leu Arg Arg Trp Ser Phe Glu Pro Gly 
50 55 60 

Thr Gly Asp Leu Arg His Glu Thr Gly Arg Phe Phe Ser Val Glu Gly 
65 70 75 80 

Leu Arg Thr Ser Ser Asp Ala Asp Pro Val Ala Arg Val Gin Pro lie 
85 90 95 

lie Val Gin Pro Glu Val Gly Leu Leu Gly lie Leu Ala Arg Glu Phe 
100 105 110 

Asp Gly Val Leu His Phe Leu Met Gin Ala Lys Pro Glu Pro Gly Asn 
115 120 125 

Val Asn Gly Leu Gin lie Ser Pro Thr Val Gin Ala Thr Arg Ser Asn 
130 135 140 

Phe Asp Glu Val His His Gly Arg Ser Thr Pro Phe Leu Asp His Phe 
145 150 155 160 

lie His Arg Pro Gly Arg Arg Val Leu He Asp Ser He Gin Ser Glu 
165 170 175 

Gin Gly Asp Trp Phe Leu His Lys Arg Asn Arg Asn Met Val Val Glu 
180 185 190 

lie Asp Thr Asp He Glu Ala Asp Ala Ala Phe Arg Trp Leu Thr Leu 
195 200 205 

Gly Gin He Arg Arg Leu Met Leu Gin Asp Asp Leu Val Asn Met Asp 
210 215 220 

Thr Arg Ser Val Leu Ala Cys Leu Pro Thr Ala His Gly Thr Pro Asp 
225 230 235 240 

Asp Gly Asp Asp Ser Phe Pro Ala Ala Leu Arg Arg Ser Leu Tyr Gly 
245 250 255 

Glu Thr Ala Pro Leu His Asp Leu His Ala He Thr Ser Cys Leu Thr 
260 265 270 

Asp Val Arg Ala Leu Arg Val Leu Arg Gin Gin Ser Val Pro Leu Asp 
275 280 285 

Asp Ala Arg Arg Asp Gly Trp Glu Arg Thr Gly Ser Ala He Arg His 
290 295 300 

Arg Ser Gly Arg His Phe Glu He Met Ala Val Glu Val Thr Ala Glu 
305 310 315 320 

Arg Arg Glu Val Ala Ser Trp Thr Gin Pro Leu Leu Arg Pro Cys Ser 
325 330 335 

Gin Gly Leu Ala Ala Leu He Thr Arg Arg He Asn Gly Val Leu His 
340 345 350 

Ala Leu Val Ala Ala Arg Ser Glu Val Gly Thr Leu Asn Val Ala Glu 
355 360 365 
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Phe Gly Pro Thr Val Gin Cys Arg Pro Asp Glu Ala Asp Gly Gin Ser 
370 375 380 

Pro Pro Tyr Leu Asp Arg Val Leu Thr Ala Gly Ala Asp Arg Val Arg 
385 390 395 400 

Tyr Asp Val Val Gin Ser Glu Glu Gly Gly Arg Phe Tyr His Ala Arg 
405 410 415 



Asn Arg Tyr Leu Val Val Glu Ala Gly Pro Glu Leu Asp Thr Gly Cys 
420 ' * 425 ' 43 0 ^ 

Pro Pro Gly Phe Cys Trp Ala Thr Phe Gly Gin Leu Thr Glu Leu Leu 
435 440 445 

Ala His Gly Asn Tyr Leu Asn Val Glu Leu Arg Thr Leu Met Ala Cvs 
450 455 460 

Ala His Ala Ser Tyr 
4 65 



<210> 42 
<211> 454 
<212> PRT 

<213> Streptomyces anibofaciens 
<400> 42 

Val Arg Val Ser Ala Asp Thr Leu Asp Ser Pro Val Thr Ala Leu Ala 
1 5 10 15 

Glu Val Pro Arg Trp Leu Glu Glu Tyr His Arg Ala His Arg Phe His 
20 25 " 30 

Val Glu Pro lie Pro Phe Asp Arg Leu Arg Arg Trp Ser Phe Glu Pro 
35 40 45 

Gly Thr Gly Asp Leu Arg His Glu Thr Gly Arg Phe Phe Ser Val Glu 
50 55 60 

Gly Leu Arg Thr Ser Ser Asp Ala Asp Pro Val Ala Arg Val Gin Pro 
65 70 75 80 

He He Val Gin Pro Glu Val Gly Leu Leu Gly He Leu Ala Arg Glu 
85 90 95 

Phe Asp Gly Val Leu His Phe Leu Met Gin Ala Lys Pro Glu Pro Gly 
100 105 110 

Asn Val Asn Gly Leu Gin He Ser Pro Thr Val Gin Ala Thr Arg Ser 
115 120 125 

Asn Phe Asp Glu Val His His Gly Arg Ser Thr Pro Phe Leu Asp His 
130 135 140 

Phe He His Arg Pro Gly Arg Arg Val Leu He Asp Ser He Gin Ser 
145 150 155 160 

Glu Gin Gly Asp Trp Phe Leu His Lys Arg Asn Arg Asn Met Val Val 
165 170 175 
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Glu He Asp Thr Asp He Glu Ala Asp Ala Ala Phe Arg Trp Leu Thr 
180 185 190 

Leu Gly Gin lie Arg Arg Leu Met Leu Gin Asp Asp Leu Val Asn Met 
195 200 205 

Asp Thr Arg Ser Val Leu Ala Cys Leu Pro Thr Ala His Gly Thr Pro 
210 215 220 

Asp Asp Gly Asp Asp Ser Phe Pro Ala Ala Leu Arg Arg Ser Leu Tyr 
225 230 235 240 

Gly Glu Thr Ala Pro Leu His Asp Leu His Ala He Thr Ser Cys Leu 
245 250 255 

Thr Asp Val Arg Ala Leu Arg Val Leu Arg Gin Gin Ser Val Pro Leu 
260 265 270 

Asp Asp Ala Arg Arg Asp Gly Trp Glu Arg Thr Gly Ser Ala lie Arg 
275 280 285 

His Arg Ser Gly Arg His Phe Glu He Met Ala Val Glu Val Thr Ala 
290 295 300 

Glu Arg Arg Glu Val Ala Ser Trp Thr Gin Pro Leu Leu Arg Pro Cys 
305 310 315 320 

Ser Gin Gly Leu Ala Ala Leu lie Thr Arg Arg He Asn Gly Val Leu 
325 330 335 

His Ala Leu Val Ala Ala Arg Ser Glu Val Gly Thr Leu Asn Val Ala 
340 345 350 

Glu Phe Gly Pro Thr Val Gin Cys Arg Pro Asp Glu Ala Asp Gly Gin 
355 360 365 

Ser Pro Pro Tyr Leu Asp Arg Val Leu Thr Ala Gly Ala Asp Arg Val 
370 375 380 

Arg Tyr Asp Val Val Gin Ser Glu Glu Gly Gly Arg Phe Tyr His Ala 
385 390 395 400 

Arg Asn Arg Tyr Leu Val Val Glu Ala Gly Pro Glu Leu Asp Thr Gly 
405 410 415 

Cys Pro Pro Gly Phe Cys Trp Ala Thr Phe Gly Gin Leu Thr Glu Leu 
420 425 430 

Leu Ala His Gly Asn Tyr Leu Asn Val Glu Leu Arg Thr Leu Met Ala 
435 440 445 

Cys Ala His Ala Ser Tyr 
450 



<210> 43 
<211> 1248 
<212> ADN 

<213> Streptomyces ambofaciens 



1er depot 



65 

<220> 

<221> CDS 

<222> (1) . . (1248) 

<400> 43 

atg ccg ggc ggg acg gac ggc gac tgc gag egg acg gcg gec egg cgt 48 

Met Pro Gly Gly Thr Asp Gly Asp Cys Ala Arg Thr Ala Ala Arg Arg 

15 10 15 



cga acg cac ctg ccc gag tec gga cga gac age gcg acg cga gag gcg 96 
Arg Thr His Leu Pro GlmSer Gly Arg Asp Ser Ala Thr Arg Glu Ala 
2 ° 25 30 

aaa atg ate aat etc ttc cag ccc cag atg ggg gee gag gaa ctg gcg 144 
Lys Met He Asn Leu Phe Gin Pro Gin Met Gly Ala Glu Glu Leu Ala 
35 40 45 

gcg gtg tec gag gtc ttc gac gac caa tgg etc ggt cac gga ccc egg 192 
Ala Val Ser Glu Val Phe Asp Asp Gin Trp Leu Gly His Gly Pro Arg 
50 55 60 

acc gcg gcg ttc gag tec gcg ttc gee gag cac etc ggg gtc ggc ccc 240 
Thr Ala Ala Phe Glu Ser Ala Phe Ala Glu His Leu Gly Val Gly Pro 
65 70 75 80 

gag cac gtc gtc ttc etc aac teg ggc acc gec ggc etc ttc ctg gee 288 
Glu His Val Val Phe Leu Asn Ser Gly Thr Ala Gly Leu Phe Leu Ala 
85 90 95 

ctg gag teg etc ggc ctg egg ccc ggc gac gag gtc gtg etc ccc teg 336. 
Leu Glu Ser Leu Gly Leu Arg Pro Gly Asp Glu Val Val Leu Pro Ser 
100 105 HO 

ccc age ttc etc gee gcg gcg aac gee gta cag etc teg gga acg cgc 3 84 
Pro Ser Phe Leu Ala Ala Ala Asn Ala Val Gin Leu Ser Gly Ala Arg 
115 12 0 125 

ccg gtg ttc tgc gac acc gac ccg egg acg ctg aac ccc gee ctg gag 432 
Pro Val Phe Cys Asp Thr Asp Pro Arg Thr Leu Asn Pro Ala Leu Glu 
130 135 14Q 



cac ate gag gcg gee gtc acc ccg cgc acc agg gec ate ate gcg etc 4 80 
His He Glu Ala Ala Val Thr Pro Arg Thr Arg Ala Val He Ala Leu 

155 160 



145 - 150 



cac tac ggc ggc cac ccc ggc gac ate gtg cgc ate gee gag cgc tgc 528 
His Tyr Gly Gly His Pro Gly Asp He Val Arg He Ala Glu. Arg Cys 
165 170 175 

egg gag egg ggc ate acc ctg ate gag gac gee gcg tgc tec gtg gee 576 
Arg Glu Arg Gly He Thr Leu He Glu Asp Ala Ala Cys Ser Val Ala 
!S0 185 190 

tec cgc gtc gac ggc cga ccg gtc ggc acc ttc ggc gac etc gee atg 624 
Ser Arg Val Asp Gly Arg Pro Val Gly Thr Phe Gly Asp Leu Ala Met 
195 200 205 

tgg age ttc gac gee atg aag gtc ctg gtc acc ggc gac gga ggg atg 672 
Trp Ser Phe Asp Ala Met Lys Val Leu. Val Thr Gly Asp Gly Gly Met 
210 215 220 
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ate tac gtc aag gac ccc ggg gcg gec gec egg ate egg cgc etc gee 72 0 
lie Tyr Val Lys Asp Pro Gly Ala Ala Ala Arg lie Arg Arg Leu Ala 
225 230 235 240 

tac cac ggc etc acg egg tec age ggc ctg gga tac gee agg gtc teg 76 8 
Tyr His Gly Leu Thr Arg Ser Ser Gly Leu Gly Tyr Ala Arg Val Ser 
245 " 250 255 

gcg cgc tgg tgg gag atg gac gtc ccc gaa ccg ggc cgc cgc gtc ate 816 
Ala Arg Trp Trp Glu Met Asp Val Pro Glu Pro Gly Arg Arg Val lie 
260 265 270 

ggg aac gac etc ace gcg gec ate ggc gcg gtc cag ttg cgc egg ctt 
Gly Asn Asp Leu Thr Ala Ala lie Gly Ala Val Glu Leu Arg Arg Leu 
275 280 285 

ccc ggc ttc gtg gec cgc cgc agg gag ate gtc gee ctg tac gac age 
Pro Gly Phe Val Ala Arg Arg Arg Glu lie Val Ala Leu Tyr Asp Ser 
290 295 300 

gaa ctg age teg ctg gag ggc gtg ctg aca ccg ccc gcg cca ccc gcg 
Glu Leu Ser Ser Leu Glu Gly Val Leu Thr Pro Pro Ala Pro Pro Ala 
305 310 315 320 

ggg cac gag tec acg cac tac ttc tac tgg ate cag ctg gec ccc ggc 
Gly His Glu Ser Thr His Tyr Phe Tyr Trp lie Gin Leu Ala Pro Gly 
325 330 335 

gtc egg gac egg gtg gca cgc gac ctg etc ace gac ggc ate tac ace 
Val Arg Asp Arg Val Ala Arg Asp Leu Leu Thr Asp Gly He Tyr Thr 
340 345 350 

acc ttc cgc tac gca cct ctg cac aag gtg ccc gec tac ggc cac ace 
Thr Phe Arg Tyr Ala Pro Leu His Lys Val Pro Ala Tyr Gly His Thr 
355 ~ 360 365 

gga ggc gaa ctg ccc ggc gtg gag egg gcg tec gaa egg acc ctg tgc 1152 
Gly Gly Glu Leu Pro Gly Val Glu Arg Ala Ser Glu Arg Thr Leu Cys 
370 375 380 

ctg ccc ctg cac ccc ggc ctg teg gac gee gac gtc cgc acc gtc gtg 
Leu Pro Leu His Pro Gly Leu Ser Asp Ala Asp Val Arg Thr Val Val 

390 395 400 



385 



tec tec ctg cgc aga gee ctg age gee gcg gat ccg gee ccc gee tga 
Ser Ser Leu Arg Arg Ala Leu Ser Ala Ala Asp Pro Ala Pro Ala 
405 410 415 



864 



912 



960 



1008 



1056 



1104 



1200 



1248 



<210> 44 
<211> 415 
<212> PRT 

<213> Streptomyces ambofaciens 
<400> 44 

Met Pro Gly Gly Thr Asp Gly Asp 
1 5 

Arg Thr His Leu Pro Glu Ser Gly 
20 



Cys Ala Arg Thr Ala Ala Arg Arg 
10 15 

Arg Asp Ser Ala Thr Arg Glu Ala 
25 30 
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Lys Met lie Asn Leu Phe Gin Pro Gin Met Gly Ala Glu Glu Leu Ala 
35 40 45 

Ala Val Ser Glu Val Phe Asp Asp Gin Trp Leu Gly His Gly Pro Arg 
50 55 60 

Thr Ala Ala Phe Glu Ser Ala Phe Ala Glu His Leu Gly Val Gly Pro 
65 70 ' 75 so 

Glu His Val Val Phe Leu Asn Ser Gly Thr Ala Gly Leu Phe Leu Ala 
85 90 95 

Leu Glu Ser Leu Gly Leu Arg Pro Gly Asp Glu Val Val Leu Pro Ser 

ioo 105 110 

Pro Ser Phe Leu Ala Ala Ala Asn Ala Val Gin Leu Ser Gly Ala Arg 
115 120 125 

Pro Val Phe Cys Asp Thr Asp Pro Arg Thr Leu Asn Pro Ala Leu Glu 
130 135 140 



His He Glu Ala Ala Val Thr Pro Arg Thr Arg Ala Val He Ala Leu 

160 



145 i5 0 155 



His Tyr Gly Gly His Pro Gly Asp He Val Arg He Ala Glu Arg Cys 
165 170 175 

Arg Glu Arg Gly He Thr Leu lie Glu Asp Ala Ala Cys Ser Val Ala 
180 185 190 

Ser Arg Val Asp Gly Arg Pro Val Gly Thr Phe Gly Asp Leu Ala Met 
195 200 205 

ffn ASP Ala Met LyS Val Leu Val Thr Gly Asp Gly Gly Met 

210 215 220 

He Tyr Val Lys Asp Pro Gly Ala Ala Ala Arg He Arg Arg Leu Ala 
225 230 235 2 40 

Tyr His Gly Leu Thr Arg Ser Ser Gly Leu Gly Tyr Ala Arg Val Ser 
245 250 255 

Ala Arg Trp Trp Glu Met Asp Val Pro Glu Pro Gly Arg Arg Val He 
260 265 " 270 

Gly Asn Asp Leu Thr Ala Ala He Gly Ala Val Gin Leu Arg Arg Leu 
275 .280 285 

Pro Gly Phe Val Ala Arg Arg Arg Glu He Val Ala Leu Tyr Asp Ser 
290 295 300 

Glu Leu Ser Ser Leu Glu Gly Val Leu Thr Pro Pro Ala Pro 



305 310 



Pro Ala 
315 320 



Gly His Glu Ser Thr His. Tyr Phe Tyr Trp He Gin Leu Ala Pro Gly 
325 330 335 

Val Arg Asp Arg Val Ala Arg Asp Leu Leu Thr Asp Gly He Tvr Thr 
340 345 350 " 

Thr Phe Arg Tyr Ala Pro Leu His Lys Val Pro Ala Tyr Gly His Thr 
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355 

Gly Gly Glu Leu Pro 
370 

Leu Pro Leu His Pro 
385 

Ser Ser Leu Arg Arg 
405 



360 

Gly Val Glu Arg Ala Ser 
375 

Gly Leu Ser Asp Ala Asp 
390 395 

Ala Leu Ser Ala Ala Asp 
410 



365 

Glu Arg Thr Leu Cys 
380 

Val Arg Thr Val Val 
400 



Pro Ala Pro Ala 
415 



<210> 45 
<211> 720 
<212> ADN 

<213> Streptomyces ambof aciens 

<220> 

<221> CDS 

<222> (1) . . (720) 

<400> 45 

atg tac gag aac gac agt gcc gcc gag gtc tac gac ctg etc tac cag 

Met Tyr Glu Asn Asp Ser Ala Ala Glu Val Tyr Asp Leu Leu Tyr Gin 
15 10 15 

gac cgc aag gac tac gcg ggt gag gcc gcc egg gtc acc gac ctg ate 
Asp Arg Lys Asp Tyr Ala Gly Glu Ala Ala Arg Val Thr Asp Leu lie 
20 25 30 



gag acc acg gcc gac ctg gag gac gcc gtc gcc gcc atg gcg egg cac 
Glu Thr Thr Ala Asp Leu Glu Asp Ala Val Ala Ala Met Ala Arg His 
115 120 125 

ctg acc gcg gac ggt gtc ctg gcc gtc gaa ccg tgg tac ttc ccc gac 
Leu Thr Ala Asp Gly Val Leu Ala Val Glu Pro Trp Tyr Phe Pro Asp 
130 135 140 

acc ttc ctg gac ggc cac gtc tec acc cac gcc ctg egg acg gca ccg. 
Thr Phe Leu Asp Gly His Val Ser Thr' His Ala Leu Arg Thr Ala Pro 



48 



96 



egg gaa cgt acg ccg gac gcg gcc age ctg etc gac ate gcg tgc ggc 144 
Arg Glu Arg Thr Pro Asp Ala Ala Ser Leu Leu Asp lie Ala Cys Gly 
35 40 45 

acc ggt acc cac ctg gag gcc ttc gcc aag etc tac gac cgc gtg age 192 
Thr Gly Thr His Leu Glu Ala Phe Ala Lys Leu Tyr Asp Arg Val Ser 
50 55 60 

ggc ctg gag ctg tec gag tgg atg gcg gcc cgc gcc gag gag egg etc 
Gly Leu Glu Leu Ser Glu Trp Met Ala Ala Arg Ala Glu Glu Arg Leu 
65 70 75 80 

ccc ggc gtc acc etc cac cgc ggt gac atg egg gcg ttc gac etc ggc 
Pro Gly Val Thr Leu His Arg Gly Asp Met Arg Ala Phe Asp Leu Gly 
85 90 95 

gag acg ttc gac gcc gtg gtc tgc atg ttc age teg ate ggg tac ctg 33 6 
Glu Thr Phe Asp Ala Val Val Cys Met Phe Ser Ser lie Gly Tyr Leu 
100 105 110 



240 



288 



384 



432 



480 
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145 150 

ggc gac cag ggc gtc gcc cgt gtc tec 
Gly Asp Gin Gly Val Ala Arg Val Ser 
165 

egg acc egg atg gag ate cac tac ctg 
Arg Thr Arg Met Glu lie His Tyr Leu 

— - 180 -.-185 

ate egg cac cgc age 'gag gtg gac tac 
He Arg His Arg Ser Glu Val Asp Tyr 
195 200 

gag tac gag gcc gcg tac cgc aag gcc 
Glu Tyr Glu Ala Ala Tyr Arg Lys Ala 
210 215 

gtg acg ggc gag ggc tea ccg ggc ttc 
Val Thr Gly Glu Gly Ser Pro Gly Phe 
225 230 



155 160 

cac teg acc egg gag ggc ggg 52 8 
His Ser Thr Arg Glu Gly Gly 
170 175 

ate gcg cac acc gcg gag ggc 576 
He Ala His Thr Ala Glu Gly 

190 

etc acg ctg ttc teg cgt gcg -624 
Leu Thr Leu Phe Ser Arg Ala 
205 

ggc ctg gac gtc gag tac gtc 672 
Gly Leu Asp Val Glu Tyr Val 
220 

ttc etc ggc acg cgt cgc tga 720 
Phe Leu Gly Thr Arg Arg 

235 240 



<210> 46 
<211> 239 
<212> PRT 

<213> Streptomyces ambof aciens 
<400> 46 

Met Tyr Glu Asn Asp Ser Ala Ala Glu Val Tyr Asp Leu Leu Tyr Gin 
15 10 15 

Asp Arg Lys Asp Tyr Ala Gly Glu Ala Ala Arg Val Thr Asp Leu He 
20 25 30 

Arg Glu Arg Thr Pro Asp Ala Ala Ser Leu Leu Asp He Ala Cvs Gly 
3 5 40 45 

Thr Gly Thr His Leu Glu Ala Phe Ala Lys Leu Tyr Asp Ara Val Ser 
50 55 60 

Gly Leu Glu Leu Ser Glu Trp Met Ala Ala Arg Ala Glu Glu Arg Leu 
65 70 75 80 

Pro Gly Val Thr Leu His Arg Gly Asp Met Arg Ala Phe Asp Leu Gly 
85 90 95 

Glu Thr Phe Asp Ala Val Val Cys Met Phe Ser Ser He Gly Tyr Leu 
100 105 110 

Glu Thr Thr Ala Asp Leu Glu Asp Ala Val Ala Ala Met Ala Arg His 
115 120 125 

Leu Thr Ala Asp Gly Val Leu Ala Val Glu Pro Trp Tyr Phe Pro Asp 
130 135 140 

Thr Phe Leu Asp Gly His Val Ser Thr His Ala Leu Arg Thr Ala Pro 
145 150 155 160 . 

Gly Asp Gin Gly Val Ala Arg Val Ser His Ser Thr Arg Glu Glv Gly 
1^5 170 175 
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Arg Thr Arg Met Glu lie His Tyr 
180 

He Arg His Arg Ser Glu Val Asp 
195 200 

Glu Tyr Glu Ala Ala Tyr Arg Lys 
210 215 

Val Thr Gly Glu Gly Ser Pro Gly 
225 230 



Leu He Ala His Thr Ala Glu Gly 
185 190 

Tyr Leu Thr Leu Phe Ser Arg Ala 
2 05 

Ala Gly Leu Asp Val Glu Tyr Val 
220 

Phe Phe Leu Gly Thr Arg Arg 
235 



<210> 47 
<211> 1968 
<212> ADN 

<213> Streptomyces ambofaciens 

<220> 

<221> CDS 

<222> (1) . . (1968) 

<400> 47 

atg agt gac ctg ggt tct ggt gaa gaa ggg tec gaa gaa gac gag teg 48 

Met Ser Asp Leu Gly Ser Gly Glu Glu Gly Ser Glu Glu Asp Glu Ser 
! 5 10 15 

gac gac gca etc gec ttc etc gag ttc ate gee egg teg gca cca egg 9 6 
Asp Asp Ala Leu Ala Phe Leu Glu Phe He Ala Arg Ser Ala Pro Arg 
20 25 30 

age gaa tac gac egg etc atg gee cgc gee gaa cgc teg ggc gee gac 144 
Ser Glu Tyr Asp Arg Leu Met Ala Arg Ala Glu Arg Ser Gly Ala Asp 
35 40 45 

gag gac egg atg cgc cga ctg gag cgc ttc aac egg etc gec etc ace 192 
Glu Asp Arg Met Arg Arg Leu Glu Arg Phe Asn Arg Leu. Ala Leu Thr 
50 55 60 



gcg cag teg atg ate gag tac cgc cgc gac egg gag gcg gag etc gcg 
Ala Gin Ser Met He Glu Tyr Arg Arg Asp Arg Glu Ala Glu Leu Ala 

70 75 80 



65 



240 



288 



gee ctg gtc gac gee gcg cac gag ttc gtc gec gec egg egg ggc aag 
Ala Leu Val Asp Ala Ala His Glu Phe Val Ala Ala Arg Arg Gly Lys 
85 90 95 

gac ctg ctg gag tec ate gec cgc aga gca egg ctg ctg ctg aag ctg 33 6 
Asp Leu Leu Glu Ser He Ala Arg Arg Ala Arg Leu Leu Leu Lys Leu 
100 105 110 

gac gtc tec tac gtc ggc ctg cac gag gag gac egg ccc ggc acg gtg 3 84 
Asp Val Ser Tvr Val Gly Leu His Glu Glu Asp Arg Pro Gly Thr Val 
115 12 0 12 5 

gtg ctg age gee gac ggc aac gcg gtc aag gtc gee gag age tac egg 43 2 
Val Leu Ser Ala Asr> Gly Asn Ala Val Lys Val Ala Glu Ser Tyr Arg 
130 135 140 
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71 



ctg ccg gcc gac ggc gga ctg ggc gcc atg gtg cgc acc tgc cgc get 480 
Leu Pro Ala Asp Gly Gly Leu Gly Ala Met Val Arg Thr Cys Arg Ala 



145 150 



155 160 



ccc ttc tgg acc ccg gac tac etc ggg gac aac age ttc acg cac gtc 52 8 

Prn Ph/a Tvta T>V>-v~ "O-v^^v 7^ m t -7 _ -.. - _ 

„^ AiAJ _ XJ _ W iyx utiu biy asp asii b'er pne Tnr His Val 

165 170 175 

_. gag gcc gtc . gac gac ate - gtc cgc gee - gaa ggc -ctg cgc gcg -gtc" ctg 57 6 

Glu Ala Val Asp Asp He Val Arg Ala Glu Gly Leu Arg Ala Val Leu 
180 185 190 

gcc gtc ccg ctg tgc gcc ggg ggc gaa ccg atg ggg gtc etc tac gtc 624 
Ala Val Pro Leu Cys Ala Gly Gly Glu Pro Met Gly Val Leu Tyr Val 
195 200 205 

gcc gac cgt cag gtg egg cat ctg acc ccc aac gag gtc acc ctg ctg 672 
Ala Asp Arg Gin Val Arg His Leu Thr Pro Asn Glu Val Thr Leu Leu 
210 215 220 

tgc teg etc gcc gat ctg gcc gcg gtg gcg ate gag cgc aac egg ctg 72 0 
Cys Ser Leu Ala Asp Leu Ala Ala Val Ala He Glu Arg Asn Arg Leu 
225 230 235 ' 240 

gtc gag gag etc cac gac acc ate ggg caa ctg cgc cag gac ate ggc 76 8 
Val Glu Glu Leu His Asp Thr He Gly Gin Leu Arg Gin Asp He Gly 
245 250 255 

gag gcc cgc acc gcc etc gcg cgc acc cgc agg tec gcc gac etc cag 816 
Glu Ala Arg Thr Ala Leu Ala Arg Thr Arg Arg Ser Ala Asp Leu Gin 
2^0 265 270 

teg cac ctg gtc acg cag gtg atg gac agg cgc ggc gcc gac teg tta 864 
Ser His Leu Val Thr Gin Val Met Asp Arg Arg Gly Ala Asp Ser Leu 
275 280 285 

etc gcg acg gcc gcc gag gcg etc ggc ggc gga gcc ggc ctg tgc age 912 
Leu Ala Thr Ala Ala Glu Ala Leu Gly Gly Gly Ala Gly Leu Cys Ser 
290 295 300 

ccg etc ggg cgc ccg etc gcc gag tac ggg acc ctg cgc ccc gtc gcc 960 
Pro Leu Gly Arg Pro Leu Ala Glu Tyr Gly Thr Leu Arg Pro Val Ala 
305 310 315 320 

ccc acg gaa ctg cgc gcg gcg tgc cgc egg gcc gcc gag acc ggc egg 1008 
Pro Thr Glu Leu Arg Ala Ala Cys Arg Arg Ala Ala Glu Thr Gly Arg 
325 330 335 

ccc acc tec gtg gcc ccg ggg gtc tgg acg gtg ccc ctg ctt ccc ggg 1056 
Pro Thr Ser Val Ala Pro Gly Val Trp Thr Val Pro Leu Leu Pro Gly 
340 345 350 

ggc aac gcc ggc ttc ctg ctg acc gac etc ggt ccg gac gcg gac cac 1104 
Gly Asn Ala Gly Phe Leu Leu Thr Asp Leu Gly Pro Asp Ala Asp His 
355 360 365 

acc gcc gtc ccc ctg etc ccg atg gtc gcc cgc acc etc gcg ctg cac 1152 
Thr Ala Val Pro Leu Leu Pro Met Val Ala Arg Thr Leu Ala Leu His 
370 375 380 



ctg cgc gtc cag cac gac gac tec ccc aag gcg cag age cac cag gag 



1200 



1 er depot 



1248 



1296 



72 

Leu Arg Val Gin His Asp Asp Ser Pro Lys Ala Gin Ser His Gin Glu 
385 390 395 400 

ttc ttc gac gac ctg ate ggg gcg ccc cgc tea ccc acg etc etc agg 
Phe Phe Asp Asp Leu lie Gly Ala Pro Arg Ser Pro Thr Leu Leu Arg 
405 410 415 

gaa cgc gec ctg atg ttc tec etc age ttc cgc cgc ccg cac gtg gtg 
Glu Arg Ala Leu Met Phe Ser Leu Ser Phe Arg Arg Pro His Val Val 
42 0 425 43 0 

ctg gtg gcg gac gga ccc cgc ggg ace teg ccg egg ctg gag gee tec 1344 
Leu Val Ala Asp Gly Pro Arg Gly Thr Ser Pro Arg Leu Glu Ala Ser 
435 440 445 

ggc gee gac tac gcg aag gag etc ggc ggg ctg tgc age gtg egg gac 13 92 
Gly Ala Asp Tyr Ala Lys Glu Leu Gly Gly Leu Cys Ser Val Arg Asp 
450 455 460 

ggc gec gtc gtc ctg ctg ctg ccc ggc gac gac ccc gtc gee gtg gcg 1440 
Gly Ala Val Val Leu Leu Leu Pro Gly Asp Asp Pro Val Ala Val Ala 
465 470 475 480 

cag acc gec gee ccg gag ctg ace gac cgc gee ggg cac ccc gtc ace 1488 
Gin Thr Ala Ala Pro Glu Leu Thr Asp Arg Ala Gly His Pro Val Thr 
485 490 495 

gtg ggg gtc gcg ggc ccc gee teg acc gtc gac ggc ate gee gac gcg 153 6 
Val Gly Val Ala Gly Pro Ala Ser Thr Val Asp Gly He Ala Asp Ala 
' 500 505 510 

cac cgt gag gee gcg aag tgt ctg gag acc etc cgc gcg etc ggc ggc 15 84 
His Arg Glu' Ala Ala Lys Cys Leu Glu Thr Leu Arg Ala Leu Gly Gly 
515 520 525 

gac ggc ggc acc gcg tgc gee tec gac ctg ggt ttc etc ggc atg etc 1632 
Asp Gly Gly Thr Ala Cys Ala Ser Asp Leu Gly Phe Leu Gly Met Leu 
530 " 535 540 

etc gee gag gag aac gac gtc ccc ggt tac ate agg acg acg ate ggc 1680 
Leu Ala Glu Glu Asn Asp Val Pro Gly Tyr He Arg Thr Thr He Gly 
545 550 555 560 

ccc gtg gtc gac tac gac acc cac cgc ttc acg gat ctg gtt ccc act 1728 
Pro Val Val Asp Tyr Asp Thr His Arg Phe Thr Asp Leu Val Pro Thr 
565 570 575 

ctg agg gtg tac ctg gag teg ggc agg age ccc acg cgt gee gca gag 177 6 
Leu Arg Val Tyr Leu Glu Ser Gly Arg Ser Pro Thr Arg Ala Ala Glu 
580 585 590 

aca ctg cgc gtg cac ccg aac acc gtc tea egg egg ctg gag cgc ate 1824 
Thr Leu Arg Val His Pro Asn Thr Val Ser Arg Arg Leu Glu Arg He 
595 600 605 

ggc gta ctg ctg gga gag gac tgg cag tea ccg gag egg gtg ctg gac 1872 
Gly Val Leu Leu Gly Glu Asp Trp Gin Ser Pro Glu Arg Val Leu Asp 
610 615 620 

ata caa ctg gee ctg egg etc tat cag gtg cgc teg gcg etc tec teg 1920 
He Gin Leu Ala Leu Arg Leu Tyr Gin Val Arg Ser Ala Leu Ser Ser 
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625 630 635 640 

caa ccg gcg tec gag acc egg gec gtg etc gga teg ctg cgc gag tga 1968 
Gin Pro Ala Ser Glu Thr Arg Ala Val Leu Gly Ser Leu Arg Glu 
645 650 655 



<210> 48 

<211>_655 . . . 

<212> PRT 

<213> Streptoirtyces ambofaciens 
<400> 48 

Met Ser Asp Leu Gly Ser Gly Glu Glu Gly Ser Glu Glu Asp Glu Ser 
1 5 10 15 

Asp Asp Ala Leu Ala Phe Leu Glu Phe lie Ala Arg Ser Ala Pro Arg 
20 25 30 

Ser Glu Tyr Asp Arg Leu Met Ala Arg Ala Glu Arg Ser Gly Ala Asp 
3 5 4 0 45 

Glu Asp Arg Met Arg Arg Leu Glu Arg Phe Asn Arg Leu Ala Leu Thr 
50 55 60 

Ala Gin Ser Met lie Glu Tyr Arg Arg Asp Arg Glu Ala Glu Leu Ala 
65 70 75 80 

Ala Leu Val Asp Ala Ala His Glu Phe Val Ala Ala Arg Arg Gly Lys 
85 90 95 

Asp Leu Leu Glu Ser lie Ala Arg Arg Ala Arg Leu Leu Leu Lys Leu 
100 105 110 

Asp Val Ser Tyr Val Gly Leu His Glu Glu Asp Arg Pro Gly Thr Val 
115 120 125 

Val Leu Ser Ala Asp Gly Asn Ala Val Lys Val Ala Glu Ser Tyr Arg 
130 135 140 

Leu Pro Ala Asp Gly Gly Leu Gly Ala Met Val Arg Thr Cys Arg Ala 
145 150 155 ~ 160 

Pro Phe Trp Thr Pro Asp Tyr Leu Gly Asp Asn Ser Phe Thr His Val 
165 170 175 

Glu Ala Val Asp Asp lie Val Arg Ala Glu Gly Leu Arg Ala Val Leu 
180 185 190 

Ala Val Pro Leu Cys Ala Gly Gly Glu Pro Met Gly Val Leu Tyr Val 
195 200 205 

Ala Asp Arg Gin Val Arg His Leu Thr Pro Asn Glu Val Thr Leu Leu 
210 215 220 

Cys Ser Leu Ala Asp Leu Ala Ala Val Ala He Glu Arg Asn Arg Leu 
225 230 235 240 

Val Glu Glu Leu His Asp Thr He Gly Gin Leu Arg Gin Asp He Gly 
245 250 " 255 
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Glu Ala Arg Thr Ala Leu Ala Arg Thr Arg Arg Ser Ala Asp Leu Gin 
260 265 270 

Ser His Leu Val Thr Gin Val Met Asp Arg Arg Gly Ala Asp Ser Leu 
275 280 285 

Leu Ala Thr Ala Ala Glu Ala Leu Gly Gly Gly Ala Gly Leu Cys Ser 
290 295 300 

Pro Leu Gly Arg Pro Leu Ala Glu Tyr Gly Thr Leu Arg Pro Val Ala 
305 310 315 320 

Pro Thr Glu Leu Arg Ala Ala Cys Arg Arg Ala Ala Glu Thr Gly Arg 
325 330 335 

Pro Thr Ser Val Ala Pro Gly Val Trp Thr Val Pro Leu Leu Pro Gly 
340 345 350 

Gly Asn Ala Gly Phe Leu Leu Thr Asp Leu Gly Pro Asp Ala Asp His 
355 360 365 

Thr Ala Val Pro Leu Leu Pro Met Val Ala Arg Thr Leu Ala Leu His 
370 375 380 

Leu Arg Val Gin His Asp Asp Ser Pro Lys Ala Gin Ser His Gin Glu 
385 390 395 400 

Phe Phe Asp Asp Leu lie Gly Ala Pro Arg Ser Pro Thr Leu Leu Arg 
405 410 415 

Glu Arg Ala Leu Met Phe Ser Leu Ser Phe Arg Arg Pro His Val Val 
420 425 430 

Leu Val Ala Asp Gly Pro Arg Gly Thr Ser Pro Arg Leu Glu Ala Ser 
435 440 445 

Gly Ala Asp Tyr Ala Lys Glu Leu Gly Gly Leu Cys Ser Val Arg Asp 
450 455 460 

Gly Ala Val Val Leu Leu Leu Pro Gly Asp Asp Pro Val Ala Val Ala 
465 470 475 480 

Gin Thr Ala Ala Pro Glu Leu Thr Asp Arg Ala Gly His Pro Val Thr 
485 490 495 

Val Gly Val Ala Gly Pro Ala Ser Thr Val Asp Gly Xle Ala Asp Ala 
500 505 510 

His Arg Glu Ala Ala Lys Cys Leu Glu Thr Leu Arg Ala Leu Gly Gly 
515 520 525 

Asp Gly Gly Thr Ala Cys Ala Ser Asp Leu Gly Phe Leu Gly Met Leu 
530 535 540 

Leu Ala Glu Glu Asn Asp Val Pro Gly Tyr lie Arg Thr Thr lie Gly 
545 550 555 560 

Pro Val Val Asp Tyr Asp Thr His Arg Phe Thr Asp Leu Val Pro Thr 
565 570 575 



Leu Arg Val Tyr Leu Glu Ser Gly Arg Ser Pro Thr Arg Ala Ala Glu 
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580 585 590 

Thr Leu Arg Val His Pro Asn Thr Val Ser Arg Arg Leu Glu Arg lie 
595 600 605 

Giy Val Leu Leu Gly Glu Asp Trp Gin Ser Fro Glu Arg val Leu Asp 
610 615 620 

Il-e Gin Leu Ala-Leu Arg Leu Tyr Gin Val Arg -Ser Ala - Leu - Ser -Ser 
625 630 635 640 

Gin Pro Ala Ser Glu Thr Arg Ala Val Leu Gly Ser Leu Arg Glu 
645 650 655 



<210> 49 
<211> 1749 
<212> ADN 

<213> Streptomyces ambofaciens 
<220> 

<221> CDS • 
<222> (1) . . (1749) 

<220> 

<221> CDS 

<222> (76) . . (1749) 

<220> 

<221> CDS 

<222> (97) _ (1749) 

<400> 49 

atg tec gca gtg gtg gcg tec ctt ctg ctt tec gtt ctt tct gcg age 48 

Met Ser Ala Val Val Ala Ser Leu Leu Leu Ser Val Leu Ser Ala Ser 

15 10 15 

gcg etc acg cat cca etc ate etc ate gtg gaa aca gga gac tta cgc 96 
Ala Leu Thr His Pro Leu lie Leu He Val Glu Thr Gly Asp Leu Arg 
,20 25 30 

gtg teg att gcg caa tac gec eta cac gac ate acg aag cgc tac cac 144 
Val Ser He Ala Gin Tyr Ala Leu His Asp He Thr Lys Arg Tyr His 
35 40 45 

gac tgt gtc gtg etc gac egg gtc ggt ttc age ate aag ccg ggc gag 192 
Asp Cys Val Val Leu Asp Arg Val Gly Phe Ser He Lys Pro Gly Glu 
50 55 60 

aag gtc ggc gtg ate ggc gac aac ggt tec ggc aag tec acg ctg etc 240 
Lys Val Gly Val He Gly Asp Asn Gly Ser Gly Lys Ser Thr Leu Leu 
65 70 75 80 

aag ate etc gee ggc cgc gtg gag ccc gac aac ggc gcg etc ace gtg 2 88 
Lys He Leu Ala Gly Arg Val Glu Pro Asp Asn Gly Ala Leu Thr Val 
85 90 95 

gtc get ccc ggc ggc gtc ggc tac ctg gcg cag aca ctg gaa ctg ccc 33 6 
Val Ala Pro Gly Gly Val Gly Tyr Leu Ala Gin Thr Leu Glu Leu Pro 
100 105 110 
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etc gac gec acc gtc cag gac gec gtc gac ctg gec ctg tec gac ctg 3 84 

Leu Asp Ala Thr Val Gin Asp Ala Val Asp Leu Ala Leu Ser Asp Leu 
115 120 125 

cgc gag etc gaa gcg gcg atg cgc gag gec gag gcg gag ctg ggc gag 432 

Arg Glu Leu Glu Ala Ala Met Arg Glu Ala Glu Ala Glu Leu Gly Glu 
130 135 140 

age gac gag aac ggc tec gag cgc gag ctg tec gec ggc etc cag cgc 480 

Ser Asp Glu Asn Gly Ser Glu Arg Glu Leu Ser Ala Gly Leu Gin Arg 

145 150 155 160 

tac gec get ctg gtc gag cag tac cag gcg cgt ggc ggc tac gag gec 528 

Tyr Ala Ala Leu Val Glu Gin Tyr Gin Ala Arg Gly Gly Tyr Glu Ala 
165 170 175 

gac gtg cgc gtg gag gtc gcg ctg cac ggc etc gga ctg ccg age ctg 576 

Asp Val Arg Val Glu Val Ala Leu His Gly Leu Gly Leu Pro Ser Leu 
180 185 190 

gac cgc gac cgc aag etc gga acc etc tec ggt ggc gaa cgc tec cgc 624 

Asp Arg Asp Arg Lys Leu Gly Thr Leu Ser Gly Gly Glu Arg Ser Arg 
195 200 205 

etc gcg etc gee gcg acc etc gee teg teg ccg gag ctg ctg etc ctg 672 

Leu Ala Leu Ala Ala Thr Leu Ala Ser Ser Pro Glu Leu Leu Leu Leu 
210 215 220 

gac gaa ccg acc aac gac etc gac gac egg gcg atg gaa tgg ctg gag 72 0 

Asp Glu Pro Thr Asn Asp Leu Asp Asp Arg Ala Met Glu Trp Leu Glu 

225 230 235 240 

gac cac ctg gee ggc cac cgc ggc acg gtg ate gcg gtc acc cac gac 768 

Asp His Leu Ala Gly His Arg Gly Thr Val lie Ala Val Thr His Asp 
245 250 255 

egg gtc ttc etc gac egg etc acc acc acg ate ctg gag gtc gac tec 816 

Arg Val Phe Leu Asp Arg Leu Thr Thr Thr lie Leu Glu Val Asp Ser 
260 265 270 

ggc age gtc acc cgc tac ggc aac ggc tac gag ggc tac ctg acg gec 864 

Gly Ser Val Thr Arg Tyr Gly Asn Gly Tyr Glu Gly Tyr Leu Thr Ala 
275 280 285 

aag gee gtg gaa cgc gag egg egg ctg egg gag tac gag gag tgg cgt 912 

Lys Ala Val Glu Arg Glu Arg Arg Leu Arg Glu Tyr Glu Glu Trp Arg 
290 295 300 

gee gaa etc gac cgc aac cgc ggg ctg ate acc tec aac gtg gcg egg 960 

Ala Glu Leu Asp Arg Asn Arg Gly Leu lie Thr Ser Asn Val Ala Arg 

305 310 315 320 

atg gac ggc ate ccg cgc aag atg tec etc tec gtg ttc ggc cac ggc 1008 

Met Asp Gly lie Pro Arg Lys Met Ser Leu Ser Val Phe Gly His Gly 
325 330 335 

gec tac cgc agg cga ggg cgc gac cac ggc gcg atg gtg egg ate cgc 1056 

Ala Tyr Arg Arg Arg Gly Arg Asp His Gly Ala Met Val Arg He Arg 
340 345 350 
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aac gcg aag caa cgc gtg gcg cag ctg acc gag aac ccg gtc cac get 1104 
Asn Ala Lys Gin Arg Val Ala Gin Leu Thr Glu Asn Pro Val His Ala 
355 360 365 

ccc gec gac ccg ttg tec ttc gec gec cgc ate gac acc gcg ggc ccg 1152 
Pro Ala Asp Pro Leu Ser Phe Ala Ala Arg lie Asp Thr Ala Gly Pro 
370 375 380 

"gag gcg "gag gag gcg gtg gee gaa etc acc gac gtg cgc gtc gcg ~ggt 1200 
Glu Ala Glu Glu Ala Val Ala Glu Leu Thr Asp Val Arg Val Ala Gly 
385 390 395 400 

egg etc gec gtg gac tec ctg acg ate egg ccc ggc gaa egg ctg etc 124 8 
Arg Leu Ala Val Asp Ser Leu Thr lie Arg Pro Gly Glu Arg Leu Leu 
405 410 415 



gtc aca ggt ccc aac ggt gcg ggc aag tec acc ttg ttg egg gtg ctg 
Val Thr Gly Pro Asn Gly Ala Gly Lys Ser Thr Leu Leu Arg Val Leu 
420 425 430 



1296 



1488 



tec ggg gaa ctg gag ccg gac ggc ggc teg gtg cgc gtc ggc tgc egg 1344 
Ser Gly Glu Leu Glu Pro Asp Gly Gly Ser Val Arg Val Gly Cys Arg 
435 440 445 

gtc ggt cat ctg egg cag gac gag acg ccc tgg gcg ccc gga ctg acc 13 92 
Val Gly His Leu Arg Gin Asp Glu Thr Pro Trp Ala Pro Gly Leu Thr 
450 455 460 

gtg ctg egg gec ttc gee cag ggc egg gag ggc tac ctg gag gac cac 1440 
Val Leu Arg Ala Phe Ala Gin Gly Arg Glu Gly Tyr Leu Glu Asp His 
465 470 475 480 

gcg gag aaa ctg ctg teg etc ggc ctg ttc age ccg tec gac ctg egg 
Ala Glu Lys Leu Leu Ser Leu Gly Leu Phe Ser Pro Ser Asp Leu Arg 
485 490 495 

cga cgc gtg aag gat ctg tec tac ggg cag cgc cgc egg ate gag ate 153 6 
Arg Arg Val Lys Asp Leu Ser Tyr Gly Gin Arg Arg Arg lie Glu lie § 
500 505 510 

gec egg ctg gtg age gac ccg atg gac ctg ctg ctg ctg gac gag ccc 15 84 
Ala Arg Leu Val Ser Asp Pro Met Asp Leu Leu Leu Leu Asp Glu Pro 
515 520 525 

acc aac cac etc acc ccg gtg ctg gtg gag gag ttg gag cag gca etc 1632 
Thr Asn His Leu Thr Pro Val Leu Val Glu Glu Leu Glu Gin Ala Leu 
530 535 540 

gcg gac tac cgc ggc gee gtc gtg gtc gtc acc cac gac cgt egg atg 1680 
Ala Asp Tyr Arg Gly Ala Val Val Val Val Thr His Asp Arg Arg Met 
545 550 555 560 

egg tec egg ttc acc ggc gee egg ctg acc atg gga gac ggg cgc ate 172 8 
Arg Ser Arg Phe Thr Gly Ala Arg Leu Thr Met Gly Asp Gly Arg lie 
565 570 575 

gec gag ttc age gec ggc tga 1749 
Ala Glu Phe Ser Ala Gly 
580 
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<210> 50 
<211> 582 
<212> PRT 

<213> Streptomyces ambofaciens 
<400> 50 

Met Ser Ala Val Val Ala Ser Leu Leu Leu Ser Val Leu Ser Ala Ser 
15 10 15 

Ala Leu Thr His Pro Leu lie Leu lie Val Glu Thr Gly Asp Leu Arg 
20 25 30 

Val Ser He Ala Gin Tyr Ala Leu His Asp He Thr Lys Arg Tyr His 
35 40 45 

Asp Cys Val Val Leu Asp Arg Val Gly Phe Ser He Lys Pro Gly Glu 
50 55 60 

Lys Val Gly Val He Gly Asp Asn Gly Ser Gly Lys Ser Thr Leu Leu 
65 70 75 80 

Lys He Leu Ala Gly Arg Val Glu Pro Asp Asn Gly Ala Leu Thr Val 
85 90 95 

Val Ala Pro Gly Gly Val Gly Tyr Leu Ala Gin Thr Leu Glu Leu Pro 
100 105 HO 

Leu Asp Ala Thr Val Gin Asp Ala Val Asp Leu Ala Leu Ser Asp Leu 
115 120 • 125 

Arg Glu Leu Glu Ala Ala Met Arg Glu Ala Glu Ala Glu Leu Gly Glu 
130 135 140 

Ser Asp Glu Asn Gly Ser Glu Arg Glu Leu Ser Ala Gly Leu Gin Arg 
.145 150 155 160 

Tyr Ala Ala Leu Val Glu Gin Tyr Gin Ala Arg Gly Gly Tyr Glu Ala 
165 170 175 

Asp Val Arg Val Glu Val Ala Leu His Gly Leu Gly Leu Pro Ser Leu 
180 185 190 

Asp Arg Asp Arg Lys Leu Gly Thr Leu Ser Gly Gly Glu Arg Ser Arg 
195 200 205 

Leu Ala Leu Ala Ala Thr Leu Ala Ser Ser Pro Glu Leu Leu Leu Leu 
210 215 220 

Asp Glu Pro Thr Asn Asp Leu Asp Asp Arg Ala Met Glu Trp Leu Glu 
225 230 235 240 

Asp His Leu Ala Gly His Arg Gly Thr Val He Ala Val Thr His Asp 
245 250 255 

Arg Val Phe Leu Asp Arg Leu Thr Thr Thr He Leu Glu Val Asp Ser 
260 265 270 

Gly Ser Val Thr Arg Tyr Gly Asn Gly Tyr Glu Gly Tyr Leu Thr Ala 
275 280 285 

Lys Ala Val Glu Arg Glu Arg Arg Leu Arg Glu Tyr Glu Glu Trp Arg 
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290 295 300 

Ala Glu Leu Asp Arg Asn Arg Gly Leu lie Thr Ser Asn Val Ala Arg 
305 310 315 320 

Met Asp Gly lie Pro Arg Lys Met Ser Leu Ser Val Phe Gly His Gly 
325 330 335 

Ala Tyr Arg "Arg" Arg Gly "Arg" Asp His "Gly Ala" "Met Val "Arg Tie "Arg" 
340 345 350 

Asn Ala Lys Gin Arg Val Ala Gin Leu Thr Glu Asn Pro Val His Ala 
355 360 365 

Pro Ala Asp Pro Leu Ser Phe Ala Ala Arg lie Asp Thr Ala Gly Pro 
370 375 380 

Glu Ala Glu Glu Ala Val Ala Glu Leu Thr Asp Val Arg Val Ala Gly 
385 390 395 400 

Arg Leu Ala Val Asp Ser Leu Thr lie Arg Pro Gly Glu Arg Leu Leu 
405 410 415 

Val Thr Gly Pro Asn Gly Ala Gly Lys Ser Thr Leu Leu Arg Val Leu 
420 425 430 

Ser Gly Glu Leu Glu Pro Asp Gly Gly Ser Val Arg Val Gly Cys Arg 
435 440 445 

Val Gly His Leu Arg Gin Asp Glu Thr Pro Trp Ala Pro Gly Leu Thr 
450 455 460 

Val Leu Arg Ala Phe Ala Gin Gly Arg Glu Gly Tyr Leu Glu Asp His 
465 470 475 480 

Ala Glu Lys Leu Leu Ser Leu Gly Leu Phe Ser Pro Ser Asp Leu Arg 
485 490 495 

Arg Arg Val Lys Asp Leu Ser Tyr Gly Gin Arg Arg Arg lie Glu lie 
500 505 510 

Ala Arg Leu Val Ser Asp Pro Met Asp Leu Leu Leu Leu Asp Glu Pro 
515 520 525 

Thr Asn His Leu Thr Pro Val Leu Val Glu Glu Leu Glu Gin Ala Leu 
530 535 540 

Ala Asp Tyr Arg Gly Ala Val Val Val Val Thr His Asp Arg Arg Met 
545 550 555 560 

Arg Ser Arg Phe Thr Gly Ala Arg Leu Thr Met Gly Asp Gly Arg lie 
565 570 575 

Ala Glu Phe Ser Ala Gly 
580 



<210> 51 
<211> 557 
<212> PRT 

<213> Streptomyces ambof aciens 
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<400> 51 

Val Glu Thr Gly Asp Leu Arg Val Ser He Ala Gin Tyr Ala Leu His 
x 5 10 15 

Asp He Thr Lys Arg Tyr His Asp Cys Val Val Leu Asp Arg Val Gly 
20 25 30 

Phe Ser He Lys Pro Gly Glu Lys Val Gly Val He Gly Asp Asn Gly 
35 40 45 

Ser Gly Lys Ser Thr Leu Leu Lys He Leu Ala Gly Arg Val Glu Pro 
50 " 55 60 

Asp Asn Gly Ala Leu Thr Val Val Ala Pro Gly Gly Val Gly Tyr Leu 
65 70 75 . 80 

Ala Gin Thr Leu Glu Leu Pro Leu Asp Ala Thr Val Gin Asp Ala Val 
85 90 95 

Asp Leu Ala Leu Ser Asp Leu Arg Glu Leu Glu Ala Ala Met Arg Glu 
100 105 HO 

Ala Glu Ala Glu Leu Gly Glu Ser Asp Glu Asn Gly Ser Glu Arg Glu 
115 120 125 

Leu Ser Ala Gly Leu Gin Arg Tyr Ala Ala Leu Val Glu Gin Tyr Gin 
130 135 140 

Ala Arg Gly Gly Tyr Glu Ala Asp Val Arg Val Glu Val Ala Leu His 
145 "* 150 155 160 

Gly Leu Gly Leu Pro Ser Leu Asp Arg Asp Arg Lys Leu Gly Thr Leu 
165 170 175 

Ser Gly Gly Glu Arg Ser Arg Leu Ala Leu Ala Ala Thr Leu Ala Ser 
180 . 185 190 

Ser Pro Glu Leu Leu Leu Leu Asp Glu Pro Thr Asn Asp Leu Asp Asp 
195 200 205 

Arg Ala Met Glu Trp Leu Glu Asp His Leu Ala Gly His Arg Gly Thr 
210 215 220 

Val He Ala Val Thr His Asp Arg Val Phe Leu Asp Arg Leu Thr Thr 
225 230 235 240 

Thr He Leu Glu Val Asp Ser Gly Ser Val Thr Arg Tyr Gly Asn Gly 
245 250 255 

Tyr Glu Gly Tyr Leu Thr Ala Lys Ala Val Glu Arg Glu Arg Arg Leu 
260 265 270 

Arg Glu Tyr Glu Glu Trp Arg Ala Glu Leu Asp Arg Asn Arg Gly Leu 
275 2 80 285 

He Thr Ser Asn Val Ala Arg Met Asp Gly He Pro Arg Lys Met Ser 
290 295 300 

Leu Ser Val Phe Gly His Gly Ala Tyr Arg Arg Arg Gly Arg Asp His 
305 310 315 320 
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Gly Ala Met Val Arg lie Arg Asn Ala Lys Gin Arg Val Ala Gin Leu 
325 330 335 

Thr Glu Asn Pro Val His Ala Pro Ala Asp Pro Leu Ser Phe Ala Ala 
340 345 3 50 

Arg lie Asp Thr Ala Gly Pro Glu Ala Glu Glu Ala Val Ala Glu Leu 

3 55 - - 3 60 ------ - -- 365 - 

Thr Asp Val Arg Val Ala Gly Arg Leu Ala Val Asp Ser Leu Thr lie 
370 375 380 

Arg Pro Gly Glu Arg Leu Leu Val Thr Gly Pro Asn Gly Ala Gly Lys 
385 390 395 400 

Ser Thr Leu Leu Arg Val Leu Ser Gly Glu Leu Glu Pro Asp Gly Gly 
405 410 415 

Ser Val Arg Val Gly Cys Arg Val Gly His Leu Arg Gin Asp Glu Thr 
420 425 430 

Pro Trp Ala Pro Gly Leu Thr Val Leu Arg Ala Phe Ala Gin Gly Arg 
435 440 445 

Glu Gly Tyr Leu Glu Asp His Ala Glu Lys Leu Leu Ser Leu Gly Leu 
450 455 460 

Phe Ser Pro Ser Asp Leu Arg Arg Arg Val Lys Asp Leu Ser Tyr Gly 
465 470 475 480 

Gin Arg Arg Arg lie Glu lie Ala Arg Leu Val Ser Asp Pro Met Asp 
485 490 495 

Leu Leu Leu Leu Asp Glu Pro Thr Asn His Leu Thr Pro Val Leu Val 
500 505 510 

Glu Glu Leu Glu . Gin Ala Leu Ala Asp Tyr Arg Gly Ala Val Val Val 
515 520 525 

Val Thr His Asp Arg Arg Met Arg Ser Arg Phe Thr Gly Ala Arg Leu 
530 535 540 

Thr Met Gly Asp Gly Arg lie Ala Glu Phe Ser Ala Gly 
545 550 555 



<210> 52 
<211> 550 
<212> PRT 

<213> Streptomyces ainbof aciens 
<400> 52 

Val Ser lie Ala Gin Tyr Ala Leu His Asp lie Thr Lys Arg Tyr His 
15 10 15 

Asp Cys Val Val Leu Asp Arg Val Gly Phe Ser lie Lys Pro Gly Glu 
20 25 30 

Lys Val Gly Val lie Gly Asp Asn Gly Ser Gly Lys Ser Thr Leu Leu 
35 40 45 
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Lys lie Leu Ala Gly Arg Val Glu Pro Asp Asn Gly Ala Leu Thr Val 
50 55 60 

Val Ala Pro Gly Gly Val Gly Tyr Leu Ala Gin Thr Leu Glu Leu Pro 
65 70 75 80 

Leu Asp Ala Thr Val Gin Asp Ala Val Asp Leu Ala Leu Ser Asp Leu 
85 90 95 

Arg Glu Leu Glu Ala Ala Met Arg Glu Ala Glu Ala Glu Leu Gly Glu 
100 105 110 

Ser Asp Glu Asn Gly Ser Glu Arg Glu Leu Ser Ala Gly Leu Gin Arg 
115 120 125 

Tyr Ala Ala Leu Val Glu Gin Tyr Gin Ala Arg Gly Gly Tyr Glu Ala' 
130 135 140 

Asp Val Arg Val Glu Val Ala Leu His Gly Leu Gly Leu Pro Ser Leu 
145 150 155 160 

Asp Arg Asp Arg Lys Leu Gly Thr Leu Ser Gly Gly Glu Arg Ser Arg 
165 170 175 

Leu Ala Leu Ala Ala Thr Leu Ala Ser Ser Pro Glu Leu Leu Leu Leu 
180 185 190 

Asp Glu Pro Thr Asn Asp Leu Asp Asp Arg Ala Met Glu Trp Leu Glu 
195 200 205 

Asp His Leu Ala Gly His Arg Gly Thr Val lie Ala Val Thr His Asp 
210 215 ' 220 

Arg Val Phe Leu Asp Arg Leu Thr Thr Thr lie Leu Glu Val Asp Ser 
225 230 235 240 

Gly Ser Val Thr Arg Tyr Gly Asn Gly Tyr Glu Gly Tyr Leu Thr Ala 
245 250 255 

Lys Ala Val Glu Arg Glu Arg Arg Leu Arg Glu Tyr Glu Glu Trp Arg 
260 265 270 

Ala Glu Leu Asp Arg Asn Arg Gly Leu lie Thr Ser Asn Val Ala Arg 
275 280 285 

Met Asp Gly He Pro Arg Lys Met Ser Leu Ser Val Phe Gly His Gly 
290 295 300 

Ala Tyr Arg Arg Arg Gly Arg Asp His Gly Ala Met Val Arg He Arg 
305 310 315 320 

Asn Ala Lys Gin Arg Val Ala Gin Leu Thr Glu Asn Pro Val His Ala 
325 330 335 

Pro Ala Asp Pro Leu Ser Phe Ala Ala Arg He Asp Thr Ala Gly Pro 
340 345 350 

Glu Ala Glu Glu Ala Val Ala Glu Leu Thr Asp Val Arg Val Ala Gly 
355 360 365 
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Arg Leu Ala Val Asp Ser Leu Thr lie Arg Pro Gly Glu Arg Leu Leu 
370 375 380 

Val Thr Gly Pro Asn Gly Ala Gly Lys Ser Thr Leu Leu Arg Val Leu 
385 390 395 400 

Ser Gly Glu Leu Glu Pro Asp Gly Gly Ser Val Arg Val Gly Cys Arg 
405 410 415 

Val Gly His Leu Arg Gin Asp Glu Thr Pro Trp Ala Pro Gly Leu Thr 
420 425 430 

Val Leu Arg Ala Phe Ala Gin Gly Arg Glu Gly Tyr Leu Glu Asp His 
435 440 445 

Ala Glu Lys Leu Leu Ser Leu Gly Leu Phe Ser Pro Ser Asp Leu Arg 
450 455 460 

Arg Arg Val Lys Asp Leu Ser Tyr Gly Gin Arg Arg Arg He Glu He 
465 470 475 480 

Ala Arg Leu Val Ser Asp Pro Met Asp Leu Leu Leu Leu Asp Glu .Pro 
485 490 495 

Thr Asn His Leu Thr Pro Val Leu Val Glu Glu Leu Glu Gin Ala Leu 
500 505 510 

Ala Asp Tyr Arg Gly Ala Val Val Val Val Thr His Asp Arg Arg Met 
515 520 525 

Arg Ser Arg Phe Thr Gly Ala Arg Leu Thr Met Gly Asp Gly Arg He 
530 535 54Q 

Ala Glu Phe Ser Ala Gly 
545 550 



<210> 53 

<211> 1431 

<212> ADN 

<213> Streptoinyces ambofaciens 

<220> 

<221> CDS 

<222> (1) . . (1431) 

<220> 

<221> CDS 

<222> (16) . . (1431) 

<220> 

<221> CDS 

<222> (37) . . (1431) 

<220> 

<221> CDS 

<222> (40) . . (1431) 



<220> 
<221> CDS 



) 



1er depot 
84 



<222> (79) . . (1431) 

<220> 
<221> CDS 

<222> (130) . . (1431) 
<400> 53 

gtg ccg cgc aac ggt atg cgt gtc gca ccg gcc gac gtg atg cag teg 
Val Pro Arg Asn Gly Met Arg Val Ala Pro Ala Asp Val Met Gin Ser 
! 5 10 15 

gac egg gat gat cgc ttg tec ggc ggc egg atg cct age etc ggg age 
Asp Arg Asp Asp Arg Leu Ser Gly Gly Arg Met Pro Ser Leu Gly Ser 
20 25 30 



egg gcc ate ggc ccc egg acc agg gcg ate atg ate gcg cac gcc ctg 
Arg Ala lie Gly Pro Arg Thr Arg Ala He Met He Ala Hxs Ala Leu 
19 5 2 00 2 05 

ggc aac ccc ttc gag gcc gaa gag gtg gcc cgc etc gcg gac gag egg 
Gly Asn Pro Phe Glu Ala Glu Glu Val Ala Arg Leu Ala Asp Glu Arg 



48 



96 



aac cac age ggt ctt tea cga gag ggg teg acc atg ggc gat etc agg 144 
Asn His Ser Gly Leu Ser Arg Glu Gly Ser Thr Met Gly Asp Leu Arg 
35 40 45 

aac cgc ate acc gag ctg gtc cgc gcg tac cac egg gaa cag gcg ccc 192 
Asn Arg He Thr Glu Leu Val Arg Ala Tyr His Arg Glu Gin Ala Pro 
50 55 60 

ggg ggc ttc gtt ccc ggg acg acg cac gta ccg gtc tec ggc gcg gtg 
Gly Gly Phe Val Pro Gly Thr Thr His Val Pro Val Ser Gly Ala Val 
65 70 75 80 

ctg age gag gag gac egg ctg gcg ctg gtg gag acg gcg ctg gag atg 
Leu Ser Glu Glu Asp Arg Leu Ala Leu Val Glu Thr Ala Leu Glu Met 
85 90 95 

egg ate gcg gcc ggc ccg gcc tec egg ggc ttc gag egg cag ttc gcc 33 6 
Arg He Ala Ala Gly Pro Ala Ser Arg Gly Phe Glu Arg Gin Phe Ala 
100 105 HO 

egg tac etc ggg etc egg aag gcg cac ctg acc aac tec ggt tec tec 3 84 
Arg Tyr Leu Gly Leu Arg Lys Ala His Leu Thr Asn Ser Gly Ser Ser 
115 120 125 



240 



288 



gcc aac etc etc gcc etc ggc gcg etc acc teg ccg cag ctg gag gag 432 
Ala Asn Leu Leu Ala Leu Gly Ala Leu Thr Ser Pro Gin Leu Glu Glu 
130 135 140 

aga egg ctg cgt ccg ggg gac gag gtc gtc acg gtc gcc gcc ggg ttc 
Arg Arg Leu Arg Pro Gly Asp Glu Val Val Thr Val Ala Ala Gly Phe 
145 150 155 160 

ccc acg acg gtc aac ccg ate ttc cac aac ggg ctg gtg ccc gtc ttc 
Pro Thr Thr Val Asn Pro He Phe His Asn Gly Leu Val Pro Val Phe. 

165 170 175 

gtg gac gtc gag etc ggc acg tac aac acg acg ccc gag cgc ate gag 57 6 
Val Asp Val Glu Leu Gly Thr Tyr Asn Thr Thr Pro Glu Arg lie Glu 
180 185 190 



480 



528 



624 



672 
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210 215 220 

gag ctg ttc etc ate gag gac aac tgc gac gcg gtg ggg tec cgc tac 72 0 
Glu Leu Phe Leu lie Glu Asp Asn Cys Asp Ala Val Gly Ser Arg Tyr 
225 230 235 ~ 240 

egg ggc agg etc ace ggc tec ttc ggc gac ctg teg ace gtc age ttc 7 68 
Arg Gly Arg Leu Thr Gly Ser Phe Gly Asp Leu Ser Thr Val Ser Phe 
- - 2.45 - _ . . _ . 2-5 0 2 5 5 - 

tat ccc gcg cac cac ate gcg atg ggt gag ggg ggc tgc gtg etc ace 816 
Tyr Pro Ala His His He Ala Met Gly Glu Gly Gly Cys Val Leu Thr 
260 265 ' 270 

gac aac ctg gec ctg gcg egg ate gtg gaa tea ctg cgc gac tgg ggg 86 4 
Asp Asn Leu Ala Leu Ala Arg He Val Glu Ser Leu Arg Asp Trp Gly 
275 280 285 

cgc gac tgc tgg tgc gag ccg ggt gag gac aac cgc tgc etc aag egg 912 
Arg Asp Cys Trp Cys Glu Pro Gly Glu Asp Asn Arg Cys Leu Lys Arg 
290 295 300 

ttc gac cag aag atg ggt gac ctg ccg ccc ggg tac gac cac aag tac 960 
Phe Asp Gin Lys Met Gly Asp Leu Pro Pro Gly Tyr Asp His Lys Tyr 
305 310 315 320 

ate ttc teg cac gtc ggt tac aac ctg aag teg acc gac ctg cag gcg 1008 
He Phe Ser His Val Gly Tyr Asn Leu Lys Ser Thr Asp Leu Gin Ala 
325 330 335 

gec etc ggg ctg tec cag ctg acc egg ate gag gag ttc acc gag gee 1056 
Ala Leu Gly Leu Ser Gin Leu Thr Arg He Glu Glu Phe Thr Glu Ala 
340 345 350 

agg cgc gee aac tgg egg cat ctg cgc gee gcg ttg gac ggg ctg ccc 1104 
Arg Arg Ala Asn Trp Arg His Leu Arg Ala Ala Leu Asp Gly Leu Pro 
355 360 365 

ggt ctg ctg ctg cct cat gee aca ccg ggc age gat ccg age tgg ttc 1152 
Gly Leu Leu Leu Pro His Ala Thr Pro Gly Ser Asp Pro Ser Trp Phe 
370 375 380 

ggg ttc etc ate acc gtg gac ccg gac gec gcg tac age agg gcg gee 12 00 
Gly Phe Leu He Thr Val Asp Pro Asp Ala Ala Tvr Ser Arg Ala Ala 
385 390 395 400 

ctg gtc gac cac ctg gaa teg cgc egg ate age acc cgc cgc ctg ttc 1248 
Leu Val Asp His Leu Glu Ser Arg Arg He Ser Thr Arg Arg Leu Phe 
405 410 415 

ggg ggc aac etc gtg egg cac ccc gee tac acc gac cgt egg tac egg 1296 
Gly Gly Asn Leu Val Arg His Pro Ala Tyr Thr Asp Arg Arg Tyr Arg 
420 425 430 

gtg tec ggc tec ctg gag aac age gac ctg ate acc gac cag acg ttc 13 44 
Val Ser Gly Ser Leu Glu Asn Ser Asp Leu He Thr Asp Gin Thr Phe 
435 440 445 

tgg ate ggg gtc ttc ccc ggc ate acc ccg gag atg ate gec tac gtc 1392 
Trp He Gly Val Phe Pro Gly lie Thr Pro Glu Met He Ala Tyr Val 
450 455 460 



) 
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ggc gac acg ate egg gag ttc gtg etc aag cac tec tga 
Gly Asp Thr lie Arg Glu Phe Val Leu Lys His Ser 
465 470 475 



<210> 54 
<211> 476 
<212> PRT 

<213> Streptomyces ambofacieris 
<400> 54 

Val Pro Arg Asn Gly Met Arg Val Ala Pro Ala Asp Val Met Gin Ser 
15 10 15 

Asp Arg Asp Asp Arg Leu Ser Gly Gly Arg Met Pro Ser Leu Gly Ser 
20 25 30 

Asn His Ser Gly Leu Ser Arg Glu Gly Ser Thr Met Gly Asp Leu Arg 
35 40 45 

Asn Arg lie Thr Glu Leu Val Arg Ala Tyr His Arg Glu Gin Ala Pro 
50 55 60 

Glv Glv Phe Val Pro Gly Thr Thr His Val Pro Val Ser Gly Ala Val 
65 70 75 80 

Leu Ser Glu Glu Asp Arg Leu Ala Leu Val Glu Thr Ala Leu Glu Met 
85 90 95 

Arg He Ala Ala Gly Pro Ala Ser Arg Gly Phe Glu Arg Gin Phe Ala 
100 105 HO 

Arg Tyr Leu Gly Leu Arg Lys Ala His Leu Thr Asn Ser Gly Ser Ser 
115 120 125 

Ala Asn Leu Leu Ala Leu Gly Ala Leu Thr Ser Pro Gin Leu Glu Glu 
130 135 140 

Arg Arg Leu Arg Pro Gly Asp Glu Val Val Thr Val Ala Ala Gly Phe 
145 150 155 160 

Pro Thr Thr Val Asn Pro He Phe His Asn Gly Leu Val Pro Val Phe 
165 170 175 

Val Asp Val Glu Leu Gly Thr Tyr Asn Thr Thr Pro Glu Arg He Glu 
180 185 190 

Arg Ala He Gly Pro Arg Thr Arg Ala He Met He Ala His Ala Leu 
195 200 205 

Gly Asn Pro Phe Glu Ala Glu Glu Val Ala Arg Leu Ala Asp Glu Arg 
210 215 220 

Glu Leu Phe Leu He Glu Asp Asn Cys Asp Ala Val Gly Ser Arg Tyr 
225 230 235 240 

Arg Gly Arg Leu Thr Gly Ser Phe Gly Asp Leu Ser Thr Val Ser Phe 
245 250 255 

Tyr Pro Ala His His He Ala Met Gly Glu Gly Gly Cys Val Leu Thr 
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260 265 270 

Asp Asn Leu Ala Leu Ala Arg He Val Glu Ser Leu Arg Asp Trp Gly 
275 280 285 

Arg Asp Cys Trp Cys Glu Fro Gly Glu Asp Asn Arg Cys Leu Lys Arg 
290 295 300 

phe Asp- Gin Lys- Met- Gly Asp Leu Pro Pro Gly Tyr Asp His Lys Tyr 
305 310 315 " 320 

He Phe Ser His Val Gly Tyr Asn Leu Lys Ser Thr Asp Leu Gin Ala 
325 330 335 

Ala Leu Gly Leu Ser Gin Leu Thr Arg He Glu Glu Phe Thr Glu Ala 
340 345 350 

Arg Arg Ala Asn Trp Arg His Leu Arg Ala Ala Leu Asp Gly Leu Pro 
355 360 365 

Gly Leu Leu Leu Pro His Ala Thr Pro Gly Ser Asp Pro Ser Trp Phe 
370 375 380 

Gly Phe Leu He Thr Val Asp Pro Asp Ala Ala Tyr Ser Arg Ala Ala 
385 390 395 400 

Leu Val Asp His Leu Glu Ser Arg Arg He Ser Thr Arg Arg Leu Phe 
405 410 415 

Gly Gly Asn Leu Val Arg His Pro Ala Tyr Thr Asp Arg Arg Tyr Arg 
420 42 5 *" 430 

Val Ser Gly Ser Leu Glu Asn Ser Asp Leu He Thr Asp Gin Thr Phe 
435 440 445 

Trp He Gly Val Phe Pro Gly He Thr Pro Glu Met He Ala Tyr Val 
450 455 460 

Gly Asp Thr He Arg Glu Phe Val Leu Lys His Ser 
465 470 475 



<210> 55 
<211> 471 
<212> PRT 

<213> Streptomyces ambof aciens 
<400> 55 

Met Arg Val Ala Pro Ala Asp Val 
1 5 

Leu Ser Gly Gly Arg Met Pro Ser 
20 

Ser Arg Glu Gly Ser Thr Met Gly 
35 40 

'Leu Val Arg Ala Tyr His Arg Glu 
50 55 

Gly Thr Thr His Val Pro Val Ser 



Met Gin Ser Asp Arg Asp Asp Arg 
10 15 

Leu Gly Ser Asn His Ser Gly Leu 
25 30 

Asp Leu Arg Asn Arg He Thr Glu 
45 

Gin Ala Pro Gly Gly Phe Val Pro 
60 

Gly Ala Val Leu Ser Glu Glu Asp 
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65 



70 75 80 



Arg Leu Ala Leu Val Glu Thr Ala Leu Glu Met Arg He Ala Ala Gly 
85 9 0 95 

Pro Ala Ser Arg Gly Phe Glu Arg Gin Phe Ala Arg Tyr Leu Gly Leu 
100 105 HO 

Arg Lys Ala His Leu Thr Asn Ser Gly Ser Ser Ala Asn Leu Leu Ala 
115 120 125 

Leu Gly Ala Leu Thr Ser Pro Gin Leu Glu Glu Arg Arg Leu Arg Pro 
130 135 140 

Gly Asp Glu Val Val Thr Val Ala Ala Gly Phe Pro Thr Thr Val Asn 
145 " 150 155 160 

Pro He Phe His Asn Gly Leu Val Pro Val Phe Val Asp Val Glu Leu 
165 170 175 

Gly Thr Tyr Asn Thr Thr Pro Glu Arg He Glu Arg Ala He Gly Pro 
180 185 190 

Arg Thr Arg Ala He Met He Ala His Ala Leu Gly Asn Pro Phe Glu 
195 200 205 

Ala Glu Glu Val Ala Arg Leu Ala Asp Glu Arg Glu Leu Phe Leu He 
210 215 220 

Glu Asp Asn Cys Asp Ala Val Gly Ser Arg Tyr Arg Gly Arg Leu Thr 
225 230 235 240 

Gly Ser Phe Gly Asp Leu Ser Thr Val Ser Phe Tyr Pro Ala His His 
245 250 . 255 

He Ala Met Gly Glu Gly Gly Cys Val Leu Thr Asp Asn Leu Ala Leu 
260 265 270 

Ala Arg He Val Glu Ser Leu Arg Asp Trp Gly Arg Asp Cys Trp Cys 
275 280 285 

Glu Pro Gly Glu Asp Asn Arg Cys Leu Lys Arg Phe Asp Gin Lys Met 
290 295 300 

Gly Asp Leu Pro Pro Gly Tyr Asp His Lys Tyr He Phe Ser His Val 
305 310 315 320 

Gly Tyr Asn Leu Lys Ser Thr Asp Leu Gin Ala Ala Leu Gly Leu Ser 
325 330 335 

Gin Leu Thr Arg He Glu Glu Phe Thr Glu Ala Arg Arg Ala Asn Trp 
340 345 350 

Arg His Leu Arg Ala Ala Leu Asp Gly Leu Pro Gly Leu Leu Leu Pro 
355 360 365 

His Ala Thr Pro Gly Ser Asp Pro Ser Trp Phe Gly Phe Leu He Thr 
370 375 380 

Val Aso Pro Asp Ala Ala Tyr Ser Arg Ala Ala Leu Val Asp His Leu* 
385 ■ 390 395 400 
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Glu Ser Arg Arg lie Ser Thr Arg 
405 

Arg His Pro Ala Tyr Thr Asp Arg 
420 

Glu Asn Ser Asp Leu lie Thr Asp 
435 440 

Pro Gly lie Thr Pro Glu Met lie 
450 455 

Glu Phe Val Leu Lys His Ser 
465 470 



Arg Leu Phe Gly Gly Asn Leu Val 
410 415 

Arg Tyr Arg Val Ser Gly Ser Leu 
425 430 

Gin Thr Phe Trp He Gly Val Phe 
445 

Ala Tyr Val Gly Asp Thr He Arg 
460 



<210> 56 
<211> 464 
<212> PRT 

<213> Streptomyces ambofaciens 

<400> 56 ..... 
Val Met Gin Ser Asp Arg Asp Asp Arg Leu Ser Gly Gly Arg Met Pro 
15 10 15 

Ser Leu Gly Ser Asn His Ser Gly Leu Ser Arg Glu Gly Ser Thr Met 
20 ' 25 30 

Gly Asp Leu Arg Asn Arg He Thr Glu Leu Val Arg Ala Tyr His Arg 
35 40 45 

Glu Gin Ala Pro Gly Gly Phe Val Pro Gly Thr Thr His Val Pro Val 
50 55 60 

Ser Gly Ala Val Leu Ser Glu Glu Asp Arg Leu Ala Leu Val Glu Thr 
65 70 75 80 

Ala Leu Glu Met Arg He Ala Ala Gly Pro Ala Ser Arg Gly Phe Glu 
85 90 95 

Arg Gin Phe Ala Arg Tyr Leu Gly Leu Arg Lys Ala His Leu Thr Asn 
100 105 110 

Ser Gly Ser Ser Ala Asn Leu Leu Ala Leu Gly Ala Leu Thr Ser Pro 
115 120 125 

Gin Leu Glu Glu Arg Arg Leu Arg Pro Gly Asp Glu Val Val Thr Val 
130 135 140 

Ala Ala Gly Phe Pro Thr Thr Val Asn Pro He Phe His Asn Gly Leu 
145 150 155 160 

Val Pro Val Phe Val Asp Val Glu Leu Gly Thr Tyr Asn Thr Thr Pro 
165 170 175 

Glu Arg He Glu Arg Ala He Gly Pro Arg Thr Arg Ala He Met He 
180 185 190 



Ala His Ala Leu Gly Asn Pro Phe Glu Ala Glu Glu Val Ala Arg Leu 
195 200 205 
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Ala Asp Glu Arg Glu Leu Phe Leu lie Glu Asp Asn Cys Asp Ala Val 
210 215 220 

Gly Ser Arg Tyr Arg Gly Arg Leu Thr Gly Ser Phe Gly Asp Leu Ser 
225 230 235 240 

Thr Val Ser Phe Tyr Pro Ala His His lie Ala Met Gly Glu Gly Gly 
245 250 255 

Cys Val Leu Thr Asp Asn Leu Ala Leu Ala Arg lie Val Glu Ser Leu 
260 265 270 

Arg Asp Trp Gly Arg Asp Cys Trp Cys Glu Pro Gly Glu Asp Asn Arg 
275 280 285 

Cys Leu Lys Arg Phe Asp Gin Lys Met Gly Asp Leu Pro Pro Gly Tyr 
290 295 300 

Asp His Lys Tyr He Phe Ser His Val Gly Tyr Asn Leu Lys Ser Thr 
305 310 315 320 

Asp Leu Gin Ala Ala Leu Gly Leu Ser Gin Leu Thr Arg He Glu Glu 
325 330 335 

Phe Thr Glu Ala Arg Arg Ala Asn Trp Arg His Leu Arg Ala Ala Leu 
340 345 350 

Asp Gly Leu Pro Gly Leu Leu Leu Pro His Ala Thr Pro Gly Ser Asp 
355 360 365 

Pro Ser Trp Phe Gly Phe Leu He Thr Val Asp Pro Asp Ala Ala Tyr 
370 ~ 375 - 380 

Ser Arg Ala Ala Leu Val Asp His Leu Glu Ser Arg Arg lie Ser Thr 
385 ~ 390 395 400 

Arg Arg Leu Phe Gly Gly Asn Leu Val Arg His Pro Ala Tyr Thr Asp 
405 410 415 

Ara Arg Tyr Arg Val Ser Gly Ser Leu Glu Asn Ser Asp Leu He Thr 
420 425 430 

Asp Gin Thr Phe Trp He Gly Val Phe Pro Gly He Thr Pro Glu Met 
435 440 445 

lie Ala Tyr Val Gly Asp Thr He Arg Glu Phe Val Leu Lys His Ser 
450 "* 455 460 



<210> 57 
<211> 463 
<212> PRT 

<213> Streptomyces ambof aciens 
<400> 57 

Met Gin Ser Asp Arg Asp Asp Arg Leu Ser Gly Gly Arg Met Pro Ser 
15 10 15 



Leu Gly Ser Asn His Ser Gly Leu Ser Arg Glu Gly Ser Thr Met Gly. 
20 25 30 
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Asp Leu Arg Asn Arg lie Thr Glu Leu Val Arg Ala Tyr His Arg Glu 
35 40 45 

Gin Ala Pro Gly Gly Phe Val Pro Gly Thr Thr His Val Pro Val Ser 
50 55 60 

Gly Ala Val Leu Ser Glu Glu Asp Arg Leu Ala Leu Val Glu Thr Ala 

65. - - - . - 70. . . . - - ........ .75 _ 80 

Leu Glu Met Arg lie Ala Ala Gly Pro Ala Ser Arg Gly Phe Glu Arg 
85 90 95 

Gin Phe Ala Arg Tyr Leu Gly Leu Arg Lys Ala His Leu Thr Asn Ser 
100 105 110 

Gly Ser Ser Ala Asn Leu Leu Ala Leu Gly Ala Leu Thr Ser Pro Gin 
115 120 125 

Leu Glu Glu Arg Arg Leu Arg Pro Gly Asp Glu Val Val Thr Val Ala 
130 135 140 

Ala Gly Phe Pro Thr Thr Val Asn Pro lie Phe His Asn Gly Leu Val 
145 " 150 155 160 

Pro Val Phe Val Asp Val Glu Leu Gly Thr Tyr Asn Thr Thr Pro Glu 
165 170 175 

Arg lie Glu Arg Ala lie Gly Pro Arg Thr Arg Ala lie Met lie Ala 
180 185 190 

His Ala Leu Gly Asn Pro Phe Glu Ala Glu Glu Val Ala Arg Leu Ala 
195 200 205 

Asp Glu Arg Glu Leu Phe Leu lie Glu Asp Asn Cys Asp Ala Val Gly 
210 215 220 

Ser Arg Tyr Arg Gly Arg Leu Thr Gly Ser Phe Gly Asp Leu Ser Thr 
225 230 235 240 

Val Ser Phe Tyr Pro Ala His His lie Ala Met Gly Glu Gly Gly Cys 
245 250 255 

Val Leu Thr Asp Asn Leu Ala Leu Ala Arg lie Val Glu Ser Leu Arg 
260 265 270 

Asp Trp Gly Arg Asp Cys Trp Cys Glu Pro Gly Glu Asp Asn Arg Cys 
275 280 285 

Leu Lys Arg Phe Asp Gin Lys Met Gly Asp Leu Pro Pro Gly Tyr Asp 
290 295 300 

His Lys Tyr lie Phe Ser His Val Gly Tyr Asn Leu Lys Ser Thr Asp 
305 310 315 320 

Leu Gin Ala Ala Leu Gly Leu Ser Gin Leu Thr Arg He Glu Glu Phe 
325 330 335 

Thr Glu Ala Arg Arg ' Ala Asn Trp Arg His Leu Arg Ala Ala Leu Asp 
340 345 350 



1er depot 



92 



Gly Leu Pro Gly Leu Leu Leu Pro His Ala Thr Pro Gly Ser Asp Pro 
355 360 365 

Ser Trp Phe Gly Phe Leu lie Thr Val Asp Pro Asp Ala Ala Tyr Ser 
370 375 380 

Arg Ala Ala Leu Val Asp His Leu Glu Ser Arg Arg lie Ser Thr Arg 
385 390 395 400 

Arg Leu Phe Gly Gly Asn Leu Val Arg His Pro Ala Tyr Thr Asp Arg 
405 410 415 

Arg Tyr Arg Val Ser Gly Ser Leu Glu Asn Ser Asp Leu lie Thr Asp 
420 425 430 

Gin Thr Phe Trp He Gly Val Phe Pro Gly He Thr Pro Glu Met He 
435 440 445 

Ala Tyr Val Gly Asp Thr He Arg Glu Phe Val Leu Lys His Ser 
450 455 460 



<210> 58 
<211> 450 
<212> PRT 

<213> Streptomyces ambof aciens 
<400> 58 

Met Pro Ser Leu Gly Ser Asn His Ser Gly Leu Ser Arg Glu Gly Ser 
1-5 10 15 

Thr Met Gly Asp Leu Arg Asn Arg He Thr Glu Leu Val Arg Ala Tyr 
20 ' 25 30 

His Arg Glu Gin Ala Pro Gly Gly Phe Val Pro Gly Thr Thr His Val 
35 40 45 

Pro Val Ser Gly Ala Val Leu Ser Glu Glu Asp Arg Leu Ala Leu Val 
50 55 60 

Glu Thr Ala Leu Glu Met Arg He Ala Ala Gly Pro Ala Ser Arg Gly 
65 70 75 80 

Phe Glu Arg Gin Phe Ala Arg Tyr Leu Gly Leu Arg Lys Ala His Leu 
85 90 95 

Thr Asn Ser Gly Ser Ser Ala Asn Leu Leu Ala Leu Gly Ala Leu Thr 
100 105 110 

Ser Pro Gin Leu Glu Glu Arg Arg Leu Arg Pro Gly Asp Glu Val Val 
115 120 125 

Thr Val Ala Ala Gly Phe Pro Thr Thr Val Asn Pro He Phe His Asn 
130 135 140 

Gly Leu Val Pro Val Phe Val Asp Val Glu Leu Gly Thr Tyr Asn Thr 
145 150 155 160 

Thr Pro Glu Arg He Glu Arg Ala He Gly Pro Arg Thr Arg Ala He 
165 170 175 
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Met lie Ala His Ala Leu Gly Asn Pro Phe Glu Ala Glu Glu Val Ala 
180 185 190 

Arg Leu Ala Asp Glu Arg Glu Leu Phe Leu lie Glu Asp Asn Cys Asp 
195 200 205 

Ala Val Gly Ser Arg Tyr Arg Gly Arg Leu Thr Gly Ser Phe Gly Asp 
210 215 220 

Leu Ser Thr Val Ser Phe Tyr Pro Ala His His He Ala Met Gly Glu 
225 230 235 240 

Gly Gly Cys Val Leu Thr Asp Asn Leu Ala Leu Ala Arg He Val Glu 
245 250 255 

Ser Leu Arg Asp Trp Gly Arg Asp Cys Trp Cys Glu Pro Gly Glu Asp 
260 265 270 

Asn Arg Cys Leu Lys Arg Phe Asp Gin Lys Met Gly Asp Leu Pro Pro 
275 280 285 

Gly Tyr Asp His Lys Tyr He Phe Ser His Val Gly Tyr Asn Leu Lys 
290 295 300 

Ser Thr Asp Leu Gin Ala Ala Leu Gly Leu Ser Gin Leu Thr Arg He 
305 310 315 320 

Glu Glu Phe Thr Glu Ala Arg Arg Ala Asn Trp Arg His Leu Arg Ala 
325 330 335 

Ala Leu Asp Gly Leu Pro Gly Leu Leu Leu Pro His Ala Thr Pro Gly 
340 345 350 

Ser Asp Pro Ser Trp Phe Gly Phe Leu He Thr Val Asp Pro Asp Ala 
355 360 365 

Ala Tyr Ser Arg Ala Ala Leu Val Asp His Leu Glu Ser Arg Arg He 
370 375 380 

Ser Thr Arg Arg Leu Phe Gly Gly Asn Leu Val Arg His Pro Ala Tyr 
385 390 395 400 

Thr Asp Arg Arg Tyr Arg Val Ser Gly Ser Leu Glu Asn Ser Asp Leu 
405 410 415 

He Thr Asp Gin Thr Phe Trp He Gly Val Phe Pro Gly He Thr Pro 
420 425 430 

Glu Met He Ala Tyr Val Gly Asp Thr He Arg Glu Phe Val Leu Lys 
435 440 445 

His Ser 
450 



<210> 59 

<211> 433 

<212> PRT 

<213> Streptomyces 



ambofaciens 



<400> 59 
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Met Gly Asp Leu Arg Asn Arg lie Thr Glu Leu Val Arg Ala Tyr His 
1 5 10 15 

Arg Glu Gin Ala Pro Gly Gly Phe Val Pro Gly Thr Thr His Val Pro 
20 25 30 

Val Ser Gly Ala Val Leu Ser Glu Glu Asp Arg Leu Ala Leu Val Glu 
35 40 45 

Thr Ala Leu Glu Met Arg lie Ala Ala Gly Pro Ala Ser Arg Gly Phe 
50 55 60 

Glu Arg Gin Phe Ala Arg Tyr Leu Gly Leu Arg Lys Ala His Leu Thr 
65 70 75 80 

Asn Ser Gly Ser Ser Ala Asn Leu Leu Ala Leu Gly Ala Leu Thr Ser 
85 90 95 

Pro Gin Leu Glu Glu Arg Arg Leu Arg Pro Gly Asp Glu Val Val Thr 
100 105 110 

Val Ala Ala Gly Phe Pro Thr Thr Val Asn Pro lie Phe His Asn Gly 
115 120 125 

Leu Val Pro Val Phe Val Asp Val Glu Leu Gly Thr Tyr Asn Thr Thr 
130 135 140 

Pro Glu Arg lie Glu Arg Ala lie Gly Pro Arg Thr Arg Ala lie Met 
145 150 155 160 

lie Ala His Ala Leu Gly Asn Pro Phe Glu Ala Glu Glu Val Ala Arg 
165 170 175 

Leu Ala Asp Glu Arg Glu Leu Phe Leu lie Glu Asp Asn Cys Asp Ala 
180 185 190 

Val Gly Ser Arg Tyr Arg Gly Arg Leu Thr Gly Ser Phe Gly Asp Leu 
195 200 205 

Ser Thr Val Ser Phe Tyr Pro Ala His His lie Ala Met Gly Glu Gly 
210 215 220 

Gly Cys Val- Leu Thr Asp Asn Leu Ala Leu Ala Arg lie Val Glu Ser 
225 230 235 240 

Leu Arg Asp Trp Gly Arg Asp Cys Trp Cys Glu Pro Gly Glu Asp Asn 
245 250 255 

Arg Cys Leu Lys Arg Phe Asp Gin Lys Met Gly Asp Leu Pro Pro Gly 
260 265 270 

Tyr Asp His Lys Tyr lie Phe Ser His Val Gly Tyr Asn Leu Lys Ser 
275 280 285 

Thr Asp Leu Gin Ala Ala Leu Gly Leu Ser Gin Leu Thr Arg lie Glu 
290 295 300 

Glu Phe Thr Glu Ala Arg Arg Ala Asn Trp Arg His Leu Arg Ala Ala 
305 310 315 320 



Leu Asp Gly Leu Pro Gly Leu Leu Leu Pro His Ala Thr Pro Gly Ser 
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325 330 335 

Asp Pro Ser Trp Phe Gly Phe Leu He Thr Val Asp Pro Asp Ala Ala 
340 345 350 

uyr ser arg Aj_a AXd j_»t;u vdx ii&j^ .u<=^ ^-^^ ^ = 

355 360 365 

Thr- Arg - Arg- -Leu Phe- Gly Gly -Asn-Leu Val -Arg His. Pro Ala Tyr Thr, 
370 375 380 

Asp Arg Arg Tyr Arg Val Ser Gly Ser Leu Glu Asn Ser Asp Leu He 
385 390 395 400 

Thr Asp Gin Thr Phe Trp He Gly Val Phe Pro Gly He Thr Pro Glu 
405 410 415 

Met He Ala Tyr Val Gly Asp Thr He Arg Glu Phe Val Leu Lys His 
420 425 430 



Ser 



<210> 60 
<211> 1398 
<212> ADN 

<213> Streptomyces ambofaciens 



<220> 

<221> CDS 

<222> (1) . . (1398) 



<400> 60 

atg gac gac acg atg gcc ggc gcc gac gcc gag gaa tgg gac ggc gat 

Met Asp Asp Thr Met Ala Gly Ala Asp Ala Glu Glu Trp Asp Gly Asp 

5 10 15 



1 



35 40 45 

etc gag egg gtg gtg etc gtc ggc ate tgg acc teg gga acg gcc gcg 
Leu Glu Arg Val Val Leu Val Gly He Trp Thr Ser Gly Thr Ala Ala 
50 55 60 

gag gcc gac agt teg etc gcc gag ctg gcg gcg etc gcc gag acc gcg 
Glu Ala Asp Ser Ser Leu Ala Glu Leu Ala Ala Leu Ala Glu Thr Ala 
65 ~ 70 75 80 

ggc gcc etc gtg ctg gac ggc gtc gtg cag cgc egg cag aag ccg gac 
Gly Ala Leu Val Leu Asp Gly Val Val Gin Arg Arg Gin Lys Pro Asp 
85 90 95 



48 



96 



cag tta gac cgc gag gac egg gcc tec etc cgc cgc gtc gcg ggg etc 

Gin Leu Asp Arg Glu Asp Arg Ala Ser Leu Arg Arg Val Ala Gly Leu 

20 25 30 

tec acc gaa ctg acc gac gtc tec gag gtc gag tac cgc cag ctg cga 144 

Ser Thr Glu Leu Thr Asp Val Ser Glu Val Glu Tyr Arg Gin Leu Arg 

or /in A R 



192 



240 



288 



ccg gcg acg tac ate ggc teg ggc aag gcg teg cag ctg cgc gac ate 336 
Pro Ala Thr Tyr He Gly Ser Gly Lys Ala Ser Gin Leu Arg Asp He 
100 105 HO 
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gtc gag gag acc ggc gcc gac acc gtg gtg tgc gac ggg gaa ctg age 
Val Glu Glu Thr Gly Ala Asp Thr Val Val Cys Asp Gly Giu Leu Ser 
115 120 125 



384 



ccc agt cag ctg atg cac ctg gag gag gtc gtc ggg gtc aag gtc gtg 43 2 
Pro Ser Gin Leu Met His Leu Glu Glu Val Val Gly Val Lys Val Val 
130 135 140 



gac cgc acg gcc ctg ate ctg gac ate ttc gcg cag cac gcc cag tec 
Asp Arg Thr Ala Leu lie Leu Asp lie Phe Ala Gin His Ala Gin Ser 

150 155 160 



145 



gag acg gac egg egg egg ate aac gac aag atg gcc agg etc cgc egg 
Glu Thr Asp Arg Arg Arg lie Asn Asp Lys Met Ala Arg Leu Arg Arg 
210 215 220 



480 



egg gag ggc aag gcg cag gtg gcg ctg gcg cag atg cag tac atg ctg 528 
Arg Glu Gly Lys Ala Gin Val Ala Leu Ala Gin Met Gin Tyr Met Leu 
165 170 175 

ccg egg ctg cgc ggc tgg ggc cag teg ctg tec egg cag atg ggc ggc 57 6 
Pro Arg Leu Arg Gly Trp Gly Gin Ser Leu Ser Arg Gin Met Gly Gly 
180 185 190 

ggt ggc ggc ggt ggc atg gcc acg cgc ggt ccc ggt gag acg aag ate 62 4 
Gly Gly Gly Gly Gly Met Ala Thr Arg Gly Pro Gly Glu Thr Lys lie 
195 200 205 



672 



gag ctg gag cag ctg aag acc ggc egg gac gtg aac egg gag gag cga 720 
Glu Leu Glu Gin Leu Lys Thr Gly Arg Asp Val Asn Arg Glu Glu Arg 
225 230 235 240 

egg cgc aac aag gtg ctg teg gtc gcc etc gcc ggc tac acc aac gcc 768 
Arg Arg Asn Lys Val Leu Ser Val Ala Leu Ala Gly Tyr Thr Asn Ala 
245 250 255 

ggc aag tea teg ctg etc aac cgc etc acc gga gcc ggc gtg ctg gtg 
Gly Lys Ser Ser Leu Leu Asn Arg Leu Thr Gly Ala Gly Val Leu Val 
260 265 270 

gag aac gcc ctg ttc gcc acc ctg gac acg acc gtg egg egg gcg acg 
Glu Asn Ala Leu Phe Ala Thr Leu Asp Thr Thr Val Arg Arg Ala Thr 
275 280 285 

acg ccg age ggg cgc ccc tac acc ate gcc gac acc gtg ggc ttc gta 
Thr Pro Ser Gly Arg Pro Tyr Thr He Ala Asp Thr Val Gly Phe Val 
290 295 300 

cgc cac etc ccg cac cac ctg gtg gag gcg ttc cgt tec acg ate gaa 
Arg His Leu Pro His His Leu Val Glu Ala Phe Arg Ser Thr He Glu 
305 310 315 320 

gag gtc gcg gac gcg cat ctg gtg ctg cac gtg gtc gac ggt teg cac 
Glu Val Ala Asp Ala His Leu Val Leu His Val Val Asp Gly Ser His 
325 330 335 

ccg gac ccc ggc gcg cag ctg gcc teg gtg cgc gag gtg ctg egg gac 1056 
Pro Asp Pro Gly Ala Gin Leu Ala Ser Val Arg Glu Val Leu Arg Asp 
340 345 350 



816 



864 



912 



960 



1008 
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gtg ggc gcc ggc gag tec acc gag gtc gtg gtc gtc aac aag gec gat 1104 
Val Gly Ala Gly Glu Ser Thr Glu Val Val Val Val Asn Lys Ala Asp 
355 360 365 

gtc gcg gac ccg gac gtc etc gcc cgt ctg ctg gag cag gag ccg gac 1152 
Val Ala Asp Pro Asp Val Leu Ala Arg Leu Leu Glu Gin Glu Pro Asp 
370 375 380 

gcg ate- gtc -gtg tec gee cgt teg ggt egg ggc ate gac gag- ctg egg - - 1200 
Ala He Val Val Ser Ala Arg Ser Gly Arg Gly He Asp Glu Leu Arg 
385 390 395 400 

gaa ctg ate gac cgc ctg ctg ccg cac ccc gag gtg gag gtg gag gtc 1248 
Glu Leu He Asp Arg Leu Leu Pro His Pro Glu Val Glu Val Glu Val 
405 410 415 

gtg ate ccc tac gac gag ggg age ctg gtg gcg egg gtg cac gac gag 1296 
Val He Pro Tyr Asp Glu Gly Ser Leu Val Ala Arg Val His Asp Glu 
420 425 430 

ggc gag gtg etc age acc gag cac acg ccg gag ggc acc ctg etc acc 1344 
Gly Glu Val Leu Ser Thr Glu His Thr Pro Glu Gly Thr Leu Leu Thr 
435 440 445 

gcg egg gtc cac ccc gac etc gcc teg gag ctt egg acg ctt ccg egg 1392 
Ala Arg Val His Pro Asp Leu Ala Ser Glu Leu Arg Thr Leu Pro Arg 
450 455 460 

ccg tga 1398 

Pro 

465 



<210> 61 
<211> 465 
<212> PRT 

<213> Streptomyces ambofaciens 
<400> 61 

Met Asp Asp Thr Met Ala Gly Ala Asp Ala Glu Glu Trp Asp Gly Asp 
15 10 15 

Gin Leu Asp Arg Glu Asp Arg Ala Ser Leu Arg Arg Val Ala Gly Leu 
20 25 30 

Ser Thr Glu Leu Thr Asp Val Ser Glu Val Glu Tyr Arg Gin Leu Arg 
35 40 45 

Leu Glu Arg Val Val Leu Val Gly He Trp Thr Ser Gly Thr Ala Ala 
50 55 60 

Glu Ala Asp Ser Ser Leu Ala Glu Leu Ala Ala Leu Ala Glu Thr Ala 
65 70 75 80 

Gly Ala Leu Val Leu Asp Gly Val Val Gin Arg Arg Gin Lys Pro Asp 
85 90 95 

Pro Ala Thr Tyr He Gly Ser Gly Lys Ala Ser Gin Leu Arg Asp He 
100 105 110 

Val Glu Glu Thr Gly Ala Asp Thr Val Val Cys Asp Gly Glu Leu Ser 
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115 120 125 

Pro Ser Gin Leu Met His Leu Glu Glu Val Val Gly Val Lys Val Val 
130 135 140 

Asp Arg Thr Ala Leu lie Leu Asp lie Phe Ala Gin His Ala Gin Ser 
145 ~ 150 155 160 

Arg Glu Gly Lys Ala Gin Val Ala Leu Ala Gin Met Gin Tyr Met Leu 
165 170 175 

Pro Arg Leu Arg Gly Trp Gly Gin Ser Leu Ser Arg Gin Met Gly Gly 
180 185 190 

Gly Gly Gly Gly Gly Met Ala Thr Arg Gly Pro Gly Glu Thr Lys lie 
195 200 205 

Glu Thr Asp Arg Arg Arg lie Asn Asp Lys Met Ala Arg Leu Arg Arg 
210 215 220 

Glu Leu Glu Gin Leu Lys Thr Gly Arg Asp Val Asn Arg Glu Glu Arg 
225 230 235 240 

Arg Arg Asn Lys Val Leu Ser Val Ala Leu Ala Gly Tyr Thr Asn Ala 
245 250 255 

Gly Lys Ser Ser Leu Leu Asn Arg Leu Thr Gly Ala Gly Val Leu Val 
260 265 270 

Glu Asn Ala Leu Phe Ala Thr Leu Asp Thr Thr Val Arg Arg Ala Thr 
275 280 285 

Thr Pro Ser Gly Arg Pro Tyr Thr He Ala Asp Thr Val Gly Phe Val 
290 295 300 

Arg His Leu Pro His His Leu Val Glu Ala Phe Arg Ser Thr He Glu 
305 310 315 320 

Glu Val Ala Asp Ala His Leu Val Leu His Val Val Asp Gly Ser His 
325 330 335 

Pro Asp Pro Gly Ala Gin Leu Ala Ser Val Arg Glu Val Leu Arg Asp 
340 345 350 

Val Gly Ala Gly Glu Ser Thr Glu Val Val Val Val Asn Lys Ala Asp 
355 360 365 

Val Ala Asp Pro Asp Val Leu Ala Arg Leu Leu Glu Gin Glu Pro Asp 
370 " 375 380 

Ala He Val Val Ser Ala Arg Ser Gly Arg Gly He Asp Glu Leu Arg 
385 390 395 400 

Glu Leu He Asp Arg Leu Leu Pro His Pro Glu Val Glu Val Glu Val 
405 410 415 

Val He Pro Tyr Asp Glu Gly Ser Leu Val Ala Arg Val His Asp Glu 
420 425 430 

Gly Glu Val Leu Ser Thr Glu His Thr Pro Glu Gly Thr Leu Leu Thr 
435 440 445 
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Ala Arg Val His Pro Asp Leu Ala Ser Glu Leu Arg Thr Leu Pro Arg 
4b0 455 460 



Pro 
465 



<210> 62 
<211> 1044 
<212> ADN 

<213> Streptomyces arnbofaciens 

<220> 

<221> CDS 

<222> (1) . . (1044) 



<400> 62 

atg cga gta etc att ate ggg ggt tea cag ttc gtg ggc egg gee ttc 
Met Arg Val Leu lie He Gly Gly Ser Gin Phe Val Gly Arg Ala Phe 

gee gee gag gca ctg gee gcg ggg cac egg gtc acc acg tte aac egg 
Ala Ala Glu Ala Leu Ala Ala Gly His Arg Val Thr Thr Phe Asn Arg 
20 25 30 

ril frti n? C ^° ^ Ctg CCC ggC gtc gag gcg gtc a ^ OTC gae 

Gly Val Ser Gly Thr Asp Leu Pro Gly Val Glu Ala Val Arg Gly Asp 

35 40 45 

Aro cif, S? ^ ^ Cgg Ctg gtg tCC gga agg cac tgg 152 

Arg Glu Val Ala Gly Asp Leu Glu Arg Leu Val Ser Gly Arg His Trp 

5 0 55 



60 



gae gcg gtc gtg gae acc tgc ggt tac gtg cec cgc acg gtg ggg gee 
Asp Ala Val Val Asp Thr Cys Gly Tyr Val Pro Arg Thr Val Gly Ala 
65 70 



7 5 80 



teg gee gcg gag ctg tee ggg cac gcg gae acc tac etc tac gtc tee 
Ser Ala Ala Ala Leu Ser Gly His Ala Asp Thr Tyr Leu Tyr Val Ser 
85 90 



95 



110 



gae gae tea ect gee cac gae tgc ceg ceg gae gec gga ccg aac cac 
Asp Asp Ser Pro Ala His Asp Cys Pro Pro Asp Ala Gly Pro Asp His 



"5 120 



125 



140 



gae egg cac tte gcg ggc egg acc ctg eae ctg egg gee ggt gtc ate 
Asp Arg His Phe Ala Gly Arg Thr Leu His Leu Arg Ala Gly Val He 
145 150 155 160 

etc ggg ccg cac gae acc atg cgc atg etc gae gec tgg ctg tgg cgc 
Leu Gly Pro His Asp Thr Met Arg Met Leu Asp Ala Trp Leu Trp Arg 



48 



96 



144 



240 



288 



Ser Tit lit 1°° Q *° tgg gCg ° ag gCg gtC Cgt Ccg ^tg ^ac 336 

Ser lie Ala Cys Leu Pro Asp Trp Ala Gin Ala Val Arg Pro Val Asp 
100 105 



384 



gec gae ggt gae tac ggc gtc ctg aag gec ggc tgc gag cgc gec gtg 432 
Ala Asp Gly Asp Tyr Gly Val Leu Lys Ala Gly Cys Glu Arg Ala Val 
130 135 



480 



528 



1er depot 



165 



100 



170 175 



atg cgc gtc gcc gag ggg gag cac cgc egg gtg etc gec ccg ggc aac 57 6 
Met Arg Val Ala Glu Gly Glu His Arg Arg Val Leu Ala Pro Gly Asn 
180 185 190 

ccc gag gtg ggc atg cgc ctg ate gac gta cgc gat gtc gcc gtc ttc 624 
Pro Glu Val Gly Met Arg Leu He Asp Val Arg Asp Val Ala Val Phe 
195 200 205 

gac etc gac tgc etc gcg gac ggc cgt acc ggc gcc ttc ate gtc aac 
Gly Leu Asp Cys Leu Ala Asp Gly Arg Thr Gly Ala Phe He Val Asn 
210 215 220 

ccg ccg gag aag aac acc acc ttc ggg gag ttg etc acg gag tgc gtc 
Pro Pro Glu Lys Asn Thr Thr Phe Gly Glu Leu Leu Thr Glu Cys Val 
225 230 235 240- 

aag gcc acc ggt teg gcc gcg gag ccg gtg tgg gtc gac gag ggg ttc 
Lys Ala Thr Gly Ser Ala Ala Glu Pro Val Trp Val Asp Glu Gly Phe 
245 250. 255 

etc gcc gag cac ggc gtg agt ccg tgg acg gac ctg ccg atg tgg gtg 816 
Leu Ala Glu His Gly Val Ser Pro Trp Thr Asp Leu Pro Met Trp Val 
260 ~ 265 270 



ccc gac acc gcg egg gac acc etc gtg tgg gcg gcc gga gca ccg cgc 
Pro Asp Thr Ala Arg Asp Thr Leu Val Trp Ala Ala Gly Ala Pro Arg 
275 280 285 



gac gcc tgg gag gtc gtc egg gac egg ccc gtc ccg gaa ctg ccg etc 
Asp Ala Trp Glu Val Val Arg Asp Arg Pro Val Pro Glu Leu Pro Leu 
305 310 315 320 

gcg gcc ggc tgc ggc ctg tec ctg age egg gag aag gag ctg etc gcc 
Ala Ala Gly Cys Gly Leu Ser Leu Ser Arg Glu Lys Glu Leu Leu Ala 
325 330 335 

gcc tgg gac get cgc ggc ggt gcg gcg gcg ggc tga 
Ala Trp Asp Ala Arg Gly Gly Ala Ala Ala Gly 
340 345 



<210> 63 
<211> 347 
<2.12> PRT 

<213> Streptomyces ambofaciens 
<400> 63 

Met Arg Val Leu He He Gly Gly Ser Gin Phe Val Gly Arg Ala Phe 
± 5 10 15 

Ala Ala Glu Ala Leu Ala Ala Gly His Arg Val Thr Thr Phe Asn Arg 
20 25 30 

Gly Val Ser Gly Thr Asp Leu Pro Gly Val Glu Ala Val Arg Gly Asp 
35 40 45 



672 



720 



768 



864 



gcc egg gcc gcg ggt ctg gcc tgc egg ccc ttc tec gac acc gtg egg 912 
Ala Arg Ala Ala Gly Leu Ala Cys Arg Pro Phe Ser Asp Thr Val Arg 
290 295 ■ 300 



960 



1008 



1044 



1 er depot 
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Arg Glu Val Ala Gly Asp Leu Glu Arg Leu Val Ser Gly Arg His Trp 
50 55 60 

Asp Ala Val Val Asp Thr Cys Gly Tyr Val Pro Arg Thr Val Gly Ala 
65 70 75 SO 

Ser Ala Ala Ala Leu Ser Gly His Ala Asp Thr Tyr Leu Tyr Val Ser 

_ 8 _5 90 95 



Ser He Ala Cys Leu Pro -Asp -Trp Ala Gin Ala - Val Arg Pro Val Asp 
1Q 0 105 no 

Asp Asp Ser Pro Ala His Asp Cys Pro Pro Asp Ala Gly Pro Asp His 

120 125 

Ala Asp Gly Asp Tyr Gly Val Leu Lys Ala Gly Cys Glu Arg Ala Val 
130 135 i4 0 

Asp Arg His Phe Ala Gly Arg Thr Leu His Leu Arg Ala Gly Val He 
4b 150 155 i 60 

Leu Gly Pro His Asp Thr Met Arg Met Leu Asp Ala Trp Leu Trp Arg 
165 170 175 

Met Arg Val Ala Glu Gly Glu His Arg Arg Val Leu Ala Pro Gly Asn 
!80 las 190 

Pro Glu Val Gly Met Arg Leu He Asp Val Arg Asp Val Ala Val Phe 
195 200 205 



Gly ofU ASP CyS LeU Ala Asp Gly Thr G1 y Ala Phe He Val 

210 215 220 



Asn 



Pro Pro Glu Lys Asn Thr Thr Phe Gly Glu Leu Leu Thr Glu Cys Val 

230 235 240 

Lys Ala Thr Gly Ser Ala Ala Glu Pro Val Trp Val Asp Glu Gly Phe 
245 250 255 

Leu Ala Glu His Gly Val Ser Pro Trp Thr Asp Leu Pro Met Trp Val 
260 265 270 

Pro Asp Thr Ala Arg Asp Thr Leu Val Trp Ala Ala Gly Ala Pro Arg 
275 280 285 

Ala Arg Ala Ala Gly Leu Ala Cys Arg Pro Phe Ser Asp Thr Val Arg 

Asp Ala Trp Glu Val Val Arg Asp Arg Pro Val Pro Glu Leu Pro Leu 
305 310 315 320 

Ala Ala Gly Cys Gly Leu Ser Leu Ser Arg Glu Lys Glu Leu Leu Ala 
325 330 335 

Ala Trp Asp Ala Arg Gly Gly Ala Ala Ala Gly 
340 345 



<210> 64 



1 er depot 



102 



<211> 1041 
<212> ADN 

<213> Streptomyces arribofaciens 

<220> 

<221> CDS 

<222> (1) - - (1041) 

<400> 64 nnn na 

atg acc gcc ctg ggt act tct get gaa ccg ttc gec gca ccc ggc ccg 48 
Met Thr Ala Leu Gly Thr Ser Ala Glu Pro Phe Ala Ala Pro Gly Pro 
1 5 1° 15 

ccg egg ccg gaa gcg tec ccg gtg ctg cgc ttc gga gcg ate ggc tgc 
Pro Arg Pro Glu Ala Ser Pro Val Leu Arg Phe Gly Ala He Gly Cys 



96 



20 



25 30 



144 



192 



ggc gac ate gcg ggc cgt cgc acc ctg ccc gcc ctg etc tec acc ccc 
Gly Asp He Ala Gly Arg Arg Thr Leu Pro Ala Leu Leu Ser Thr Pro 
35 40 45 

ggc acc gtg ctg acc tgc gtc ggc age cgc gac gcg gac egg gcc aag 
Gly Thr Val Leu Thr Cys Val Gly Ser Arg Asp Ala Asp Arg Ala Lys 
50 55 60 

gcc ctg ggc agg cac ttc gac tgc gag gcg gtc gcg ccc tac gag gcc 240 
Ala Leu Gly Arg His Phe Asp Cys Glu Ala Val Ala Pro Tyr Glu Ala 

75 yu 



65 70 



ctg ctg gaa cgc ccc gac gtg gac gcc gtc tac ate gcg gtg ccc age 
Leu Leu Glu Arg Pro Asp Val Asp Ala Val Tyr He Ala Val Pro Ser 



85 



90 95 



atg ctg cac gcc gaa tgg gcc gcg gcg gcg ctg egg gcg ggc aaa cac 
Met Leu His Ala Glu Trp Ala Ala Ala Ala Leu Arg Ala Gly Lys His 

105 H° 



100 



288 



336 



384 



gtc etc gtg gag aag ccc gcc gcc gcc aac cac gcc gac gcg gcc cgc 
Val Leu Val Glu Lys Pro Ala Ala Ala Asn His Ala Asp Ala Ala Arg 
115 120 125 

ctg ttc gcc atg gcc egg gag cgc gga ctg gta ctg atg gag aac ttc 43 2 
Leu Phe Ala Met Ala Arg Glu Arg Gly Leu Val Leu Met Glu Asn Phe 
130 135 140 

atg ttc etc cac cac tct caa cac gcc acc gtc aaa gcc ctg ttg gag 
Met Phe Leu His His Ser Gin His Ala Thr Val Lys Ala Leu Leu Glu 

155 160 



480 



528 



145 150 

gcc ggt gcc ate gga gag ctg cgc acc ttc tec gcc gcc ttc acc ate 

Ala Gly Ala He Gly Glu Leu Arg Thr Phe Ser Ala Ala Phe Thr He 
165 170 175 

ccg ccg cgc gcc gac gac gac atg cgc tac cga ccc gac ate ggc ggc 57 6 

Pro Pro Arg Ala Asp Asp Asp Met Arg Tyr Arg Pro Asp He Gly Gly 

180 185 190 



ggc gca ctg etc gac aac ggc gtc tac ccg ctg egg gcc gcg ctg cac 
Gly Ala Leu Leu Asp Asn Gly Val Tyr Pro Leu Arg Ala Ala Leu His 
195 200 205 



624 
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ttc etc gga ccc gaa ctg cgc ctg acc ggc gec gtg ctg cgc cgt gac 672 
Phe Leu Gly Pro Glu Leu Arg Leu Thr Gly Ala Val Leu Arg Arg Asp 
210 215 220 

cgc cgc egg ggc gtc gtg gtc tec ggc age gtc ctg etc gee gee ccc 72 0 
Arg Arg Arg Gly Val Val Val Ser Gly Ser Val Leu Leu Ala Ala Pro 
225 230 235 240 

cag ggc gtg_gcc gec cac etc gec ttc ggc atg_.gaa_ cac . ggc tac . cgc 7 68 .. 
Gin Gly Val Ala Ala His Leu Ala Phe Gly Met Glu His Gly Tyr Arg 
245 250 255 

teg gcg tac gag ctg cac ggc age acc ggc teg etc gee ctg age cac 816 
Ser Ala Tyr Glu Leu His Gly Ser Thr Gly Ser Leu Ala Leu Ser His 
260 265 270 

gtc ttc acg acc ccg gac age cac cac ccc gta ctg egg ctg tec cgc 864 
Val Phe Thr Thr Pro Asp Ser His His Pro Val Leu Arg Leu Ser Arg 
275 280 285 

cag gac cac egg gag gag cgc gtc ctg ccc gtg gac egg cac ttc gtg 912 
Gin Asp His Arg Glu Glu Arg Val Leu Pro Val Asp Arg His Phe Val 
290 295 300 

aac ate ctg teg gtc ttc cgc cgt gcg gtg ate egg gec gag gac gtc 96 0 
Asn lie Leu Ser Val Phe Arg Arg Ala Val lie Arg Ala Glu Asp Val 
305 310 315 320 

tec gec gag teg tac gec gcg ctg cgc cag gcg ggg ctg gtc gac gag 1008 
Ser Ala Glu Ser Tyr Ala Ala Leu Arg Gin Ala Gly Leu Val Asp Glu 
325 330 335 

ate gtg gec cgc gee gag acc ttc acc gtg tag 1041 
lie Val Ala Arg Ala Glu Thr Phe Thr Val 
340 345 



<210> 65 
<211> 346 
<212> PRT 

<213> Streptoinyces ambofaciens 
<400> 65 

Met Thr Ala Leu Gly Thr Ser Ala Glu Pro Phe Ala Ala Pro Gly Pro 
15 10 15 

Pro Arg Pro Glu Ala Ser Pro Val Leu Arg Phe Gly Ala lie Gly Cys 
20 25 30 

Gly Asp lie Ala Gly Arg Arg Thr Leu Pro Ala Leu Leu Ser Thr Pro 
35 40 45 

Gly Thr Val Leu Thr Cys Val Gly Ser Arg Asp Ala Asp Arg Ala Lys 
50 55 60 

Ala Leu Gly Arg His Phe Asp Cys Glu Ala Val Ala Pro Tyr Glu Ala 
65 70 75 80 

Leu Leu Glu Arg Pro Asp Val Asp Ala Val Tyr He Ala Val Pro Ser 
85 90 95 



1 er depot 
104 



Met Leu His Ala Glu Trp Ala Ala Ala Ala Leu Arg Ala Gly Lys His 
100 105 110 

Val Leu Val Glu Lys Pro Ala Ala Ala Asn His Ala Asp Ala Ala Arg 
115 120 125 

Leu Phe Ala Met Ala Arg Glu Arg Gly Leu Val Leu Met Glu Asn Phe 
130 135 140 

Met Phe Leu His His Ser Gin His Ala Thr Val Lys Ala Leu Leu Glu 
145 150 155 160 

Ala Gly Ala lie Gly Glu Leu Arg Thr Phe Ser Ala Ala Phe Thr lie 
165 170 175 

Pro Pro Arg Ala Asp Asp Asp Met Arg Tyr Arg Pro Asp lie Gly Gly 
180 185 190 

Gly Ala Leu Leu Asp Asn Gly Val Tyr Pro Leu Arg Ala Ala Leu His 
195 200 205 

Phe Leu Gly Pro Glu Leu Arg Leu Thr Gly Ala Val Leu Arg Arg Asp 
210 215 220 

Arg Arg Arg Gly Val Val Val Ser Gly Ser Val Leu Leu Ala Ala Pro 
225 230 235 240 

Gin Gly Val Ala Ala His Leu Ala Phe Gly Met Glu His Gly Tyr Arg 
245 250 255 

Ser Ala Tyr Glu Leu His Gly Ser Thr Gly Ser Leu Ala Leu Ser His 
260 265 270 

Val Phe Thr Thr Pro Asp Ser His His Pro Val Leu Arg Leu Ser Arg 
275 280 285 

Gin Asp His Arg Glu Glu Arg Val Leu Pro Val Asp Arg His Phe Val 
290 295 300 

Asn He Leu Ser Val Phe Arg Arg Ala Val He Arg Ala Glu Asp Val 
305 310 315 320 

Ser Ala Glu. Ser Tyr Ala Ala Leu Arg Gin Ala Gly Leu Val Asp Glu 
325 330 335 

He Val Ala Arg Ala Glu Thr Phe Thr Val 
340 345 



<21'0> 66 
<211> 1239 
<212> ADN 

<213> Streptomyces ambofaciens 

<220> 

<221> CDS 

<222> (1) . . (1239) 

<400> 66 

gtg acg gac gcg ate acg acc gag ctg gec gac cgc gaa ctg <ggg cgc 



1er depot 



105 



Val Thr Asp Ala lie Thr Thr Glu Leu Ala Asp Arg Glu Leu Gly Arg 

15 10 15 

aga ctg cac egg ata cgc ggc gtc cac tgg tat ttc ggc aac cac ggt 96 

Arg Leu His Arg lie Arg Gly Val His Trp Tyr Phe Gly Asn His Gly 
20 25 30 

gac ccg tac gec etc ate ctg cgc ggt cag acc gac gac ccg teg gtg 144 

Asp Pro Tyr Ala Leu lie Leu Arg Gly Gin Thr Asp Asp Pro Ser Val 

~~ 35 40 " 45 

tac gag gag egg gtc cgc gag ggc ggg ccg ctg ttc cgc age cgt acc 192 

Tyr Glu Glu Arg Val Arg Glu Gly Gly Pro Leu Phe Arg Ser Arg Thr 

50 55 60 

ggg acc tgg gtg acc gcg gac ccg gag gtg gec gcg gec gtg ctg ggc 240 

Gly Thr Trp Val Thr Ala Asp Pro Glu Val Ala Ala Ala Val Leu Gly 

65 70 75 80 

gac teg cgc ttc ggt gcg ctg gac cgc gee gga egg cgc ccg gag gag 2 88 

Asp Ser Arg Phe Gly Ala Leu Asp Arg Ala Gly Arg Arg Pro Glu Glu 

85 90 95 

tac etc cag ccg teg ccc gec acg tac ctg ggg ctg gac cgc gec gcg 33 6 

Tyr Leu Gin Pro Ser Pro Ala Thr Tyr Leu Gly Leu Asp Arg Ala Ala 

100 105 110 

tac gcg cgt ctg egg egg gtg gec gag ccc gtg ctg ggc gcg gac gec 3 84 

Tyr Ala Arg Leu Arg Arg Val Ala Glu Pro Val Leu Gly Ala Asp Ala 

115 120 125 

gee gee gcg tgg cgc egg etc ggc gag gac gtc ggg cgc egg ctg etc 432 

Ala Ala Ala Trp Arg Arg Leu Gly Glu Asp Val Gly Arg Arg Leu Leu 

130 135 140 

gec ggc cgc ggt tec ggc etc gac ctg acg gcg gac ttc gec cgc egg 4 80 

Ala Gly Arg Gly Ser Gly Leu Asp Leu Thr Ala Asp Phe Ala Arg Arg 

145 150 155 160 

ctg ccg gca ttg gtc ctg gec gcg tgg etc ggg gtg ccg ggc gaa egg 52 8 

Leu Pro Ala Leu Val Leu Ala Ala Trp Leu Gly Val Pro Gly Glu Arg 

165 ' 170 175 

tgc gac gag tgg gag gag teg ctg egg gcg gcg ggg ccg ctg ctg gac 57 6 

Gys Asp Glu Trp Glu Glu Ser Leu Arg Ala Ala Gly Pro Leu Leu Asp 

180 185 190 

ggt ctg ctg tgt ccg cag acg ctg gcg gec acc cgt gcg gcg gac teg 624 

Gly Leu Leu Cys Pro Gin Thr Leu Ala Ala Thr Arg Ala Ala Asp Ser 

195 200 205 

gec gec gag ggg ctg cgc gcg ctg ttg gac gag gtg gtc gec gcg cgt 672 

Ala Ala Glu Gly Leu Arg Ala Leu -Leu Asp Glu Val Val Ala Ala Arg 

210 215 220 

ccc ggc ggg tec ggc gag ggt gcg gtg gec cgc atg gtc ggc gee gga 720 

Pro Gly Gly Ser Gly Glu Gly Ala Val Ala Arg Met Val Gly Ala Gly 

225 230 235 240 



gee gee ccc gac gac gcg gtg gee gee gee gtg tgc ctg gcg etc teg 
Ala Ala Pro Asp Asp Ala Val Ala Ala Ala Val Cys Leu Ala Leu Ser 



768 
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245 250 255 

gcc gtc gaa ccg acg acg acc ctg gtg tgc gaa gcg gtc egg ctg ctg 816 
Ala Val Glu Pro Thr Thr Thr Leu Val Cys Glu Ala Val Arg Leu Leu 
260 265 270 

etc gac cga ccc gag tgg tgg egg egg ttg tgc gac tec ccc get ctg 864 
Leu Asp Arg Pro Glu Trp Trp Arg Arg Leu Cys Asp Ser Pro Ala Leu 
275 280 285 

gcg ccg gcc gcg gtc egg cac acc ctg egg cac gcg ccc ccg gtg egg 912 
Ala Pro Ala Ala Val Arg His Thr Leu Arg His Ala Pro Pro. Val Arg 
290 295 300 

ctg gag age egg gtg gcc cac gag gac gtg acg gtg gcg gat cgt ccg 9 60 
Leu Glu Ser Arg Val Ala His Glu Asp Val Thr Val Ala Asp Arg Pro 
305 310 315 320 

ctg ccc gcc ggg age cac gtg gtg gtg etc gtg ggc gcg gca egg cgc 1008 
Leu Pro Ala Gly Ser His Val Val Val Leu Val Gly Ala Ala Arg Arg 
325 330 335 

gcg ggc gcc ccg gcc gcg gag ccg gcg gac ctg gcg ggc gca ccg gcg 105 6 
Ala Gly Ala Pro Ala Ala Glu Pro Ala Asp Leu Ala Gly Ala Pro Ala 
340 345 350 

gcg gag ctg ccg gac gac ctg tgg ttc gcg ctg tec ggg gag ttc gtc 1104 
Ala Glu Leu Pro Asp Asp Leu Trp Phe Ala Leu Ser Gly Glu Phe Val 
355 360 365 

ggc cgt gcc gcc gag acc gcg ctg ggc gtg ctg gcc gag gcc gcc ccg 1152 
Gly Arg Ala Ala Glu Thr Ala Leu Gly Val Leu Ala Glu Ala Ala Pro 
370 375 . 380 

gga ctg egg egg gac ggc gac ate gtc egg egg cgc cgt tee ccg gtc 1200 
Gly Leu Arg Arg Asp Gly Asp lie Val Arg Arg Arg Arg Ser Pro Val 
385 390 395 400 

etc ggc agg tac gcg egg ttc ccc gtc gcg tac tec tga 123 9 

Leu Gly Arg Tyr Ala Arg Phe Pro Val Ala Tyr Ser 
405 410 



<210> 67 
<211> 412 
<212> PRT 

<213> Streptomyces ambof aciens 
<400> 67 

Val Thr Asp Ala lie Thr Thr Glu Leu Ala Asp Arg Glu Leu Gly Arg 
1 5 10 15 

Arg Leu His Arg lie Arg Gly Val His Trp Tyr Phe Gly Asn His Gly 
20 25 30 

Asp Pro Tyr Ala Leu He Leu Arg Gly Gin Thr Asp Asp Pro Ser Val 
35 40 45 



Tyr Glu Glu Arg Val Arg Glu Gly Gly Pro Leu Phe Arg Ser Arg Thr 
50 55 60 
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107 



Gly Thr Trp Val Thr Ala Asp Pro Glu Val Ala Ala Ala .Val Leu Gly 
65 70 75 80 

Asp Ser Arg Phe Gly Ala Leu Asp Arg Ala Gly Arg Arg Pro Glu Glu 
85 90 95 

Tyr Leu Gin Pro Ser Pro Ala Thr Tyr Leu Gly Leu Asp Arg Ala Ala 
100 105 110 

Tyr Ala Arg Leu Arg Arg Val Ala Glu Pro Val Leu Gly Ala Asp Ala 
115 120 125 

Ala Ala Ala Trp Arg Arg Leu Gly Glu Asp Val Gly Arg Arg Leu Leu 
130 135 140 

Ala Gly Arg Gly Ser Gly Leu Asp Leu Thr Ala Asp Phe Ala Arg Arg 
145 150 155 160 

Leu Pro Ala Leu Val Leu Ala Ala Trp Leu Gly Val Pro Gly Glu Arg 
165 170 175 

Cys Asp Glu Trp Glu Glu Ser Leu Arg Ala Ala Gly Pro Leu Leu Asp 
180 185 190 

Gly Leu Leu Cys Pro Gin Thr Leu Ala Ala Thr Arg Ala Ala Asp Ser 
195 200 205 

Ala Ala Glu Gly Leu Arg Ala Leu Leu Asp Glu Val Val Ala Ala Arg 
210 215 220 

Pro Gly Gly Ser Gly Glu Gly Ala Val Ala Arg Met Val Gly Ala Gly 
225 230 235 240 

Ala Ala Pro Asp Asp Ala Val Ala Ala Ala Val Cys Leu Ala Leu Ser 
245 250 255 

Ala Val Glu Pro Thr Thr Thr Leu Val Cys Glu Ala Val Arg Leu Leu 
260 265 270 

Leu Asp Arg Pro Glu Trp Trp Arg Arg Leu Cys Asp Ser Pro Ala Leu 
275 280 285 

Ala Pro Ala Ala Val Arg His Thr Leu Arg His Ala Pro Pro Val Arg 
290 295 300 

Leu Glu Ser Arg Val Ala His Glu Asp Val Thr Val Ala Asp Arg Pro 
305 310 315 320 

Leu Pro Ala Gly Ser His Val Val Val Leu Val Gly Ala Ala Arg Arg 
325 330 335 

Ala Gly Ala Pro Ala Ala Glu Pro Ala Asp Leu Ala Gly Ala Pro Ala 
340 345 350 

Ala Glu Leu Pro Asp A.sp Leu Trp Phe Ala Leu Ser Gly Glu Phe Val 
355 360 365 

Gly Arg Ala Ala Glu Thr Ala Leu Gly Val Leu Ala Glu Ala Ala Pro 
370 -375 380 



Gly Leu Arg Arg Asp Gly Asp lie Val Arg Arg Arg Arg Ser Pro Val 
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385 390 395 400 

Leu Gly Arg Tyr Ala Arg Phe Pro Val Ala Tyr Ser 
405 410 



<210> 68 
<211> 1272 
<212> ADN 

<213> Streptomyces ambofaciens 



<220> 

<221> CDS 

<222> (1) . . (1272) 



<400> 68 

gtg cgc gtc ctg gtg acc tec ate ccg cac cac acg cac tac tac cac 48 

Val Arg Val Leu Val Thr Ser lie Pro His His Thr His Tyr Tyr His 
1 5 .10 15 

ctg gta ccg ctg ate tgg get ctg cgt gee teg ggg cac gag gtg gtg 9 6 
Leu Val Pro Leu He Trp Ala Leu Arg Ala Ser Gly His Glu Val Val 
20 25 30 

gcg gee ggc cag ccg teg ctg gtc gac gec ate acc gee age ggc ate 144 
Aia Ala Gly Gin Pro Ser Leu Val Asp Ala He Thr Ala Ser Gly He 
35 .40 45 

ccg gcg ttc gee ctg gee gag gag gag teg ctg gcg cag ate ttc gag 192 
Pro Ala Phe Ala Leu Ala Glu Glu Glu Ser Leu Ala Gin He Phe Glu 
50 55 60 

gag gtc gag ggc gat etc cag ccg tat cag cac ggc ate gac gag ttc 24 0 
Glu Val Glu Gly Asp Leu Gin Pro Tyr Gin His Gly He Asp Glu Phe 
65 70 75 80 

gac ttc ttc ggc acc ctg aag gac gag ctg gac tgg gag aag ctg etc 2 88 
Asp Phe Phe Gly Thr Leu Lys Asp Glu Leu Asp Trp Glu Lys Leu Leu 
85 90 95 

gee cag cag gtg ate ctg tec ggc ctg tgg ctg gaa ccg etc aac ggc 33 6 
Ala Gin Gin Val He Leu Ser Gly Leu Trp Leu Glu Pro Leu Asn Gly 
100 105 110 

gee acg acc etc gac age ate gtc gac ttc gee egg gee tgg aag ccc 384 
Ala Thr Thr Leu Asp Ser He Val Asp Phe Ala Arg Ala Trp Lys Pro 
115 120 125 

gac ctg gtg ctg tgg gag ccg ttc acc tat gcg ggg ccg gtg gcg gee 43 2 
Asp Leu Val Leu Trp Glu Pro Phe Thr Tyr Ala Gly Pro Val Ala Ala 
130 135 140 

egg gcg tgc ggg gee gcg cac gee cgc gtc ctg tgg ggg ccg gac acg 4 80 
Arg Ala Cys Gly Ala Ala His Ala Arg Val Leu Trp Gly Pro Asp Thr 
145 150 155 160 

ate ggg ctg ctg egg acg aag ttc ctt cag gec cag gcg cgt cag ccc 528 
He Gly Leu Leu Arg Thr Lys Phe Leu Gin Ala Gin Ala Arg Gin Pro 
165 170 175 
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gag ccg egg ttc cgc gac ggc gcg egg egg ctg aag gag egg atg egg 
Glu Pro Arg Phe Arg Asp Gly Ala Arg Arg Leu Lys Glu Arg Met Arg 
385 390 395 400 



768 



816 



gag gag cac egg gac gac ccg gtc gcg gag tgg atg acc tgg gec ctg 57 6 
Glu Glu His Arg Asp Asp Pro Val Ala Glu Trp Met Thr Trp Ala Leu 
180 185 190 

gcg cgc tac ggg tgc gac ttc egg gag gag gac gtg etc ggt cag tgg 624 
Ala Arg Tyr Gly Cys Asp Phe Arg Glu Glu Asp Val Leu Gly Gin Trp 
195 200 205 

age. gtg. gac ccg atg .gcg gag ggc gtc agt ctg ggc etc gac ctg ccg 672 
Ser Val Asp Pro Met Ala Glu Gly Val Ser Leu Gly Leu Asp Leu Pro 
210 215 220 

acc gtc ccg atg cgc tac acc ccg tac aac ggg teg gcg gtg ate ccc 72 0 
Thr Val Pro Met Arg Tyr Thr Pro Tyr Asn Gly Ser Ala Val Xle Pro 
225 230 235 240 

gac tgg ctg acc gag gaa ccg aaa egg cct egg gtc tgc ctg acc ctg 
Asp Trp Leu Thr Glu Glu Pro Lys Arg Pro Arg Val Cys Leu Thr Leu 
245 250 255 

ggg gtg tec teg egg gag cac agt gag gac gag gtc ccg gtg cag agg 
Gly Val Ser Ser Arg Glu His Ser Glu Asp Glu Val Pro Val Gin Arg 
260 , 265 270 

ttt ate gag gcg ctg gec gat etc gac ate gag ctg gtg gcg acc ctg 864 
Phe Xle Glu Ala Leu Ala Asp Leu Asp lie Glu Leu Val Ala Thr Leu 
275 280 285 

gac gac gec cag egg gac ctg ctg ccg agg ate ccg gac aac acg cgc 912 
Asp Asp Ala Gin Arg Asp Leu Leu Pro Arg He Pro Asp Asn Thr Arg 
290 295 300 

ate gtc gac ttc gtg ccc atg gac gcg ttg ctg ccg acg tgc teg gcg 960 
He Val Asp Phe Val Pro Met Asp Ala Leu Leu Pro Thr Cys Ser Ala 
305 310 315 320 

ate ate aac cac age ggt teg ggc acg tgc aac acc gec gcg ctg cac 1008 
He lie Asn His Ser Gly Ser Gly Thr Cys Asn Thr Ala Ala Leu His 
325 330 335 

ggg gtg ccg cag ate ate etc ggc ggc ate ctg gac gec gee gta egg 1056 
Gly Val Pro Gin lie He Leu Gly Gly He Leu Asp Ala Ala Val Arg 
340 345 350 

cag cac atg ttc gcg cag aac tee gec gee etc ace tte get eeg gag 1104 
Gin His Met Phe Ala Gin Asn Ser Ala Ala Leu Thr Phe Ala Pro Glu 
355 360 365 

gag gtg acc ggc gcg teg ctg agg age gcg ctg gtg cgc ctg etc gag 1152 
Glu Val Thr Gly Ala Ser Leu Arg Ser Ala Leu Val Arg Leu Leu Glu 
370 375 380 



1200 



gee atg ccc age ccg gec ggg ate gtg ccg acc ctg gag cgc etc acg 1248 
Ala Met Pro Ser Pro Ala Gly He Val Pro Thr Leu Glu Arg Leu Thr 
405 410 415 



gec cag cac cgc egg gcg tgt tga 



1272 
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Ala Gin His Arg Arg Ala Cys 
420 



<210> 69 
<211> 423 
<212> PRT 

<213> Streptomyces ambof aciens 
<400> 69 

Val Arg Val Leu Val Thr Ser lie Pro His His Thr His Tyr Tyr His 
15 10 15 

Leu Val Pro Leu lie Irp Ala Leu Arg Ala Ser Gly His Glu Val Val 
20 25 30 

Ala Ala Gly Gin Pro Ser Leu Val Asp Ala lie Thr Ala Ser Gly lie 
35 40 45 

Pro Ala Phe Ala Leu Ala Glu Glu Glu Ser Leu Ala Gin lie Phe Glu 
50 55 60 

Glu Val Glu Gly Asp Leu Gin Pro Tyr Gin His Gly He Asp Glu Phe 
65 70 75 80 

Asp Phe Phe Gly Thr Leu Lys Asp Glu Leu Asp Trp Glu Lys Leu Leu 
85 90 95 

Ala Gin Gin Val He Leu Ser Gly Leu Trp Leu Glu Pro Leu Asn Gly 
100 105 HO 

Ala Thr Thr Leu Asp Ser He Val Asp Phe Ala Arg Ala Trp Lys Pro 
115 120 125 

Asp Leu Val Leu Trp Glu Pro Phe Thr Tyr Ala Gly Pro Val Ala Ala 
130 135 140 

Arg Ala Cys Gly Ala Ala His Ala Arg Val Leu Trp Gly Pro Asp Thr 
145 150 155 160 

He Gly Leu Leu Arg Thr Lys Phe Leu Gin Ala Gin Ala Arg Gin Pro 
165 170 175 

Glu Glu His Arg Asp Asp Pro Val Ala Glu Trp Met Thr Trp Ala Leu 
180 185 190 

Ala Arg Tyr Gly Cys Asp Phe Arg Glu Glu Asp Val Leu *Gly Gin Trp 
195 200 205 

Ser Val Asp Pro Met Ala Glu Gly Val Ser Leu Gly Leu Asp Leu Pro 
210 215 220 

Thr Val Pro Met Arg Tyr Thr Pro Tyr Asn Gly Ser Ala Val He Pro 
225 230 235 240 

Asp Trp Leu Thr Glu Glu Pro Lys Arg Pro Arg Val Cys Leu Thr Leu 
245 250 255 

Gly Val Ser Ser Arg Glu His Ser Glu Asp Glu Val Pro Val Gin Arg 
260 265 270 
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Phe lie Glu Ala Leu Ala Asp Leu Asp lie Glu Leu Val Ala Thr Leu 
275 280 285 

Asp Asp Ala Gin Arg Asp Leu Leu Pro Arg lie Pro Asp Asn Thr Arg 
290 295 300 

lie Val Asp Phe Val Pro Met Asp Ala Leu Leu Pro Thr Cys Ser Ala 
305 " 310 315 320 

lie lie Asn His Ser ~Gly Ser Gly Thr" Cys " Asn Thr Ala "Ala "'lieu His ' 
325 . 330 , 335 

Gly Val Pro Gin lie lie Leu Gly Gly He Leu Asp Ala Ala Val Arg 
340 345 350 

Gin His Met Phe Ala Gin Asn Ser Ala Ala Leu Thr Phe Ala Pro Glu 
355 360 365 

Glu Val Thr Gly Ala Ser Leu Arg Ser Ala Leu Val Arg Leu Leu Glu 
370 375 380 

Glu Pro Arg Phe Arg Asp Gly Ala Arg Arg Leu Lys Glu Arg Met Arg 
385 390 395 400 

Ala Met Pro Ser Pro Ala Gly He Val Pro Thr Leu Glu Arg Leu Thr 
405 410 415 

Ala Gin His Arg Arg Ala Cys 
420 



<210> 


70 






<211> 


1179 






<212> 


ADN 






<213> 


Strep tomyces ambofaciens 






<220> 








<221> 


CDS 






<222> 


(1) . . (1179) 






<400> 


70 






atg egg gec etc ttc acg acc gcg 


ccg 


etc 


Met Arg Ala Leu Phe Thr Thr Ala 


Pro 


Leu 


1 


5 




10 



g ggc cac ctg ctt ccg 48 
a Gly His Leu Leu Pro 
15 

ctg gtg ccc ate gcg tgg gec ctg egg gcg gec ggc cac gag gta ctg 96 
Leu Val Pro He Ala Trp Ala Leu Arg Ala Ala Gly His Glu Val Leu 
20 25 30 

gtg gcg acc egg gag gac ttc gtg ccg gtc gec ctg egg teg ggg ctg 144 
Val Ala Thr Arg Glu Asp Phe Val Pro Val Ala Leu Arg Ser Gly Leu 
35 40 45 

ccg tec gec teg tgc ggg ccg ccc gec gcg gac ctg gcg ggc gcg gec 192 
Pro Ser Ala Ser Cys Gly Pro Pro Ala Ala Asp Leu Ala Gly Ala Ala 
50 55 60 

gag gcg ggg gcg etc gcg egg ccc cgc gga gcg gcg gag get egg ggg 240 
Glu Ala Gly Ala Leu Ala Arg Pro Arg Gly Ala Ala Glu Ala Arg Gly 
65 70 75 80 
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gtc ctg age ggg gcg ctg gcg cgc gtc gec egg ggc agt ctg gcg ggg 2 88 
Val Leu Ser Gly Ala Leu Ala Arg Val Ala Arg Gly Ser Leu Ala Gly 
85 90 95 

gtg egg egg ctg gcg gac gee tgg egg ccg gat ctg ate gtc age gaa 33 6 
Val Arg Arg Leu Ala Asp Ala Trp Arg Pro Asp Leu lie Val Ser Glu 
100 105 110 

egg gec gag ttc gec ggg ccg ctg gtc gcg gcg gec etc ggg gtc ccg 384 
Arg Ala Glu Phe Ala Gly Pro Leu Val Ala Ala Ala Leu Gly Val Pro 
115 120 125 

tgg gtc cgc tac cac tgg teg gtc teg tec ctg gag gag tac egg cga 432 
Trp Val Arg Tyr His Trp Ser Val Ser Ser Leu Glu Glu Tyr Arg Arg 
130 135 140 

gcg gee gag gee gag ttc gcg ccc gag ctg gcg gcg etc ggc etc gac 480 
Ala Ala Glu Ala Glu Phe Ala Pro Glu Leu Ala Ala Leu Gly Leu Asp 
145 150 155 160 

egg ttc ccg gag gcg gcg cgc gtg etc gat ccg tgg ccg gtg teg ctg 52 8 
Arg Phe Pro Glu Ala Ala Arg Val Leu Asp Pro Trp Pro Val Ser Leu 
165 170 175 

cgc egg ccg gac' gcg gtc gee cac gac ggg gtc egg cac gta ccg gec 57 6 
Arg Arg Pro Asp Ala Val Ala His Asp Gly Val Arg His Val Pro Ala 
180 185 190 

cac ggg gac gee ccc gtc ccc gac tgg gcg ttc acg cgc ggt cgc ggg 624 
His Gly Asp Ala Pro Val Pro Asp Trp Ala Phe Thr Arg Gly Arg Gly 
195 200 205 

ccg egg ate tgc gtg acg etc ggc ace atg ctg ccc egg tac ggc gee 672 
Pro Arg lie Cys Val Thr Leu Gly Thr Met Leu Pro Arg Tyr Gly Ala 
210 215 220 

gec ggg atg gee gac ttc ctg acg gag ctg gtg gcg gag acc cgc gga 72 0 
Ala Gly Met Ala Asp Phe Leu Thr Glu Leu Val Ala Glu Thr Arg Gly 
225 230 235 240 

ggg gac tgc gaa ctg etc gtg gcg gtc gac gac gac gtc gtc gcg egg 768 
Gly Asp Cys - Glu Leu Leu Val Ala Val Asp Asp Asp Val Val Ala Arg 
245 250 255 

tgg ccg teg ctg ccc tec gcg gtg egg tac gee ggc egg ctg ccg ctg 816 
Trp Pro Ser Leu Pro Ser Ala Val Arg Tyr Ala Gly Arg Leu Pro Leu 
260 265 270 

gcg. gag gtg ctg ccc gcg tgc gac gcg gtg gtg cac cac ggc ggg cag 864 
Ala Glu Val Leu Pro Ala Cys Asp Ala Val Val His His Gly Gly Gin 
275 280 285 

ggc acg tec ctg acc gcg ctg gee gcg ggt egg ccg cag gtc gtc atg 912 
Gly Thr Ser Leu Thr Ala Leu Ala Ala Gly Arg Pro Gin Val Val Met 
290 295 300 

gcg egg etc gac gac cag ttc gac aac gcg egg gca ctg gcg gcg gcg 960 
Ala Arg Leu Asp Asp Gin Phe Asp Asn Ala Arg Ala Leu Ala Ala Ala 
305 310 315 320- 
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99Q gcg gcc ctg etc gta ccg ccg tec egg gec act ccc gcg gec gtg 1008 

Gly Ala Ala Leu Leu Val Pro Pro Ser Arg Ala Thr Pro Ala Ala Val 

325 330 335 

gcc gcg ggg tgc gcc gaa gtg ctg gag aac gcc ctg tat gcc aag gcg 1056 

Ala Ala Gly Cys Ala Glu Val Leu Glu Asn Ala Leu Tyr Ala Lys Ala 

340 345 350 

gca gcc ggg etc gcc gag -gag - at g-- gcg ctg ctg ccg - teg ccg- -teg gcg - -1104 

Ala Ala Gly Leu Ala Glu Glu Met Ala Leu Leu Pro Ser Pro Ser Ala 

355 360 365 

gcg gtc gga etc ctg gaa cac ccg ggg ccc ggg ccg gac atg ccg egg 1152 

Ala Val Gly Leu Leu Glu His Pro Gly Pro Gly Pro Asp Met Pro Arg 

370 375 380 

agt tac ccg aac gag gat gcg gtg tga 117 9 

Ser Tyr Pro Asn Glu Asp Ala Val 
385 390 



<210> 71 
<211> 392 
<212> PRT 

<213> Streptomyces ambof aciens 
<400> 71 

Met Arg Ala Leu Phe Thr Thr Ala Pro Leu Ala Gly His Leu Leu Pro 
15 10 15 

Leu Val Pro lie Ala Trp Ala Leu Arg Ala Ala Gly His Glu Val Leu 
20 25 30 

Val Ala Thr Arg Glu Asp Phe Val Pro Val Ala Leu Arg Ser Gly Leu 
35 40 45 

Pro Ser Ala Ser Cys Gly Pro Pro Ala Ala Asp Leu Ala Gly Ala Ala 
50 55 60 

Glu Ala Gly Ala Leu Ala Arg Pro Arg Gly Ala Ala Glu Ala Arg Gly 
65 70 75 80 

Val Leu Ser Gly Ala Leu Ala Arg Val Ala Arg Gly Ser Leu Ala Gly 
85 90 95 

Val Arg Arg Leu Ala Asp Ala Trp Arg Pro Asp Leu lie Val Ser Glu 
100 105 110 

Arg Ala Glu Phe Ala Gly Pro Leu Val Ala Ala Ala Leu Gly Val Pro 
115 120 125 

Trp Val Arg Tyr His Trp Ser Val Ser Ser Leu Glu Glu Tyr Arg Arg 
130 135 140 

Ala Ala Glu Ala Glu Phe Ala Pro Glu Leu Ala Ala Leu Gly Leu Asp 
145 150 155 160 

Arg Phe Pro Glu Ala Ala Arg Val Leu Asp Pro Trp Pro Val Ser Leu 
165 170 175 



Arg Arg Pro Asp Ala Val Ala His Asp Gly Val Arg His Val Pro Ala 
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180 185 190 

His Gly Asp Ala Pro Val Pro Asp Trp Ala Phe Thr Arg Gly Arg Gly 
195 200 205 

Pro Arg lie Cys Val Thr Leu Gly Thr Met Leu Pro Arg Tyr Gly Ala 
210 215 220 

Ala Gly Met Ala Asp Phe Leu Thr Glu Leu Val Ala Glu Thr Arg Gly 
225 230 235 240 

Gly Asp Cys Glu Leu Leu Val Ala Val Asp Asp Asp Val Val Ala Arg 
245 250 255 

Trp Pro Ser Leu Pro Ser Ala Val Arg Tyr Ala Gly Arg Leu Pro Leu 
260 265 270 

Ala Glu Val Leu Pro Ala Cys Asp Ala Val Val His His Gly Gly Gin 
275 280 285 

Gly Thr Ser Leu Thr Ala Leu Ala Ala Gly Arg Pro Gin Val Val Met 
290 295 300 

Ala Arg Leu Asp Asp Gin Phe Asp Asn Ala Arg Ala Leu Ala Ala Ala 
305 ~ 310 315 320 

Gly Ala Ala Leu Leu Val Pro Pro Ser Arg Ala Thr Pro Ala Ala Val 
325 330 335 

Ala Ala Gly Cys Ala Glu Val Leu Glu Asn Ala Leu Tyr Ala Lys Ala 
340 345 350 

Ala Ala Gly .Leu Ala Glu Glu Met Ala Leu Leu Pro Ser Pro Ser Ala 
355 360 365 

Ala Val Gly Leu Leu Glu His Pro Gly Pro Gly Pro Asp Met Pro Arg 
370 "* 375 380 

Ser Tyr Pro Asn Glu Asp Ala Val 
385 390 



<210> 72 
<211> 993 
<212> ADN 

<213> Streptomyces ambofaciens 

<220> 

<221> CDS 

<222> (1)..(993) 

<400> 72 

gtg aat ctg gaa gta etc aac cgt teg aac gat ccg cgc ggg ccg gtg 

Val Asn Leu Glu Val Leu Asn Arg Ser Asn Asp Pro Arg Gly Pro Val 
15 10 15 

ate acg gtg gtc ggc gcg tec ggc ttc ate ggg tec gee ctg gtc gee 
lie Thr Val Val Gly Ala Ser Gly Phe He Gly Ser Ala Leu Val Ala 
20 25 30 
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gag ctg gcg cgc atg ccg gtg egg ctg egg gcg gtg gee egg cgc gag 144 

Glu Leu Ala Arg Met Pro Val Arg Leu Arg Ala Val Ala Arg Arg Glu 

35 40 45 

acc ccc gtt ccc gcg ggg gca egg gec gec gtc gag gtc cgc egg gcg 192 

Thr Pro Val Pro Ala Gly Ala Arg Ala Ala Val Glu Val Arg Arg Ala 

50 55 60 

gac etc gee egg; ccg gac gag gtc ggg gec gee gtc gag ggg gcg gac 240 

Asp Leu Ala Arg Pro Asp Glu Val Gly Ala Ala Val Glu Gly Ala Asp 

65 70 75 80 

gec gtc gtg cac etc gee gee cac ate ggc ggc gcg egg teg tgg cgc 2 88 

Ala Val Val His Leu Ala Ala His lie Gly Gly Ala Arg Ser Trp Arg 

85 90 95 

gcg gee gac gag egg teg ctg egg gtg aac gtc ggt ctg ctg cgc gac 3 36 

Ala Ala Asp Glu Arg Ser Leu Arg Val Asn Val Gly Leu Leu Arg Asp 

100 105 110 

gtg gee gac gcg ttc egg gac cgc teg ggg ccc gec ccg gee gtg gtc 384 

Val Ala Asp Ala Phe Arg Asp Arg Ser Gly Pro Ala Pro Ala Val Val 

115 120 125 

ctg gee agt acc etc cag gec ggc gtc gag ctg tec egg cag ggc ccg 432 

Leu Ala Ser Thr Leu Gin Ala Gly Val Glu Leu Ser Arg Gin Gly Pro 

130 135 140 

tac gee egg cag aag teg gcg gee gag gag gtc ctg ctg egg gee gec 480 

Tyr Ala Arg Gin Lys Ser Ala Ala Glu Glu Val Leu Leu Arg Ala Ala 

145 150 155 160 

tec gag gag gtg gtc cgc ggc gtc gtg ctg egg ctg ccg acc gtc tac 528 

Ser Glu Glu Val Val Arg Gly Val Val Leu Arg Leu Pro Thr Val Tyr 

165 170 175 

ggg cgc age ccg ctg acc ggg tgg acg ggc cgc ggg gtg gtc gcg teg 576 

Gly Arg Ser Pro Leu Thr Gly Trp Thr Gly Arg Gly Val Val Ala Ser 

180 185 190 

gtg gca egg cag gee gtc teg ggc gag ccg gtc acg atg tgg cac gac 624 

Val Ala Arg Gin Ala Val Ser Gly Glu Pro Val Thr Met Trp His Asp 

195 200 205 

ggc acg gtc ggg cgc gat ctg etc cac gtg gag gac gcg gc-G cgc gec 672 

Gly Thr Val Gly Arg Asp Leu Leu His Val Glu Asp Ala Ala Arg Ala 

210 215 220 

ttc gcg gcg gcg etc ggt cac gtg gag egg ctg gac ggc ggc acg tgg 720 

Phe Ala Ala Ala Leu Gly His Val Glu Arg Leu Asp Gly Gly Thr Trp 

225 230 235 240 

tec gtc ggt acg ggc egg ctg gag ccc ttg gga gag gtg ttc teg gec 768 

Ser Val Gly Thr Gly Arg Leu Glu Pro Leu Gly Glu Val Phe Ser Ala 

245 250 255 

etc gec ggg ctg gtg gec gag egg acg ggg agg ccc ccc gta ccg gtg 816 

Leu Ala Gly Leu Val Ala Glu Arg Thr Gly Arg Pro Pro Val Pro Val 

260 - 265 270 



gtc 



tec acg gag ccg ccc gac cat gee gag gcg ggc gac ttc gag age 



864 
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Val Ser Thr Glu Pro Pro Asp His Ala 
275 280 

gcg gtc tgt gac ccc tec gcg ttc cgc 
Ala Val Cys Asp Pro Ser Ala Phe Arg 
290 295 

etc gtt ccg ttg egg gcg ggg etc ggc 
Leu Val Pro Leu Arg Ala Gly Leu Gly 
305 310 

gec gac gga gcg agg ggt ggg ate cga 
Ala Asp Gly Ala Arg Gly Gly He Arg 
325 



Glu Ala Gly Asp Phe Glu Ser 
285 

gcg gtg acc ggg tgg tct ccc 912 
Ala Val Thr Gly Trp Ser Pro 
300 

gec gtg gtg gag acg atg gtg 960 
Ala Val Val Glu Thr Met Val 
315 320 

acg tga 993 

Thr 

330 



<210> 73 
<211> 330 
<212> PRT 

<213> Streptomyces ambof aciens 
<400> 73 

Val Asn Leu Glu Val Leu Asn Arg Ser Asn Asp Pro Arg Gly Pro Val 
15 10 15 

He Thr Val Val Gly Ala Ser Gly Phe He Gly Ser Ala Leu Val Ala 
20 25 30 

Glu Leu Ala Arg Met Pro Val Arg Leu Arg Ala Val Ala Arg Arg Glu 
35 40 45 

Thr Pro Val Pro Ala Gly Ala Arg Ala Ala Val Glu Val Arg Arg Ala 
50 55 . 60 

Asp Leu Ala Arg Pro Asp Glu Val Gly Ala Ala Val Glu Gly Ala Asp 
65 70 75 80 

Ala Val Val His Leu Ala Ala His He Gly Gly Ala Arg Ser Trp Arg 
85 90 95 

Ala Ala Asp Glu Arg Ser Leu Arg Val Asn Val Gly Leu Leu Arg Asp 
100 105 HO 

Val Ala Asp Ala Phe Arg Asp Arg Ser Gly Pro Ala Pro Ala Val Val 
115 120 125 

Leu Ala Ser Thr Leu Gin Ala Gly Val Glu Leu Ser Arg Gin Gly Pro 
130 135 140 

Tyr Ala Arg Gin Lys Ser Ala Ala Glu Glu Val Leu Leu Arg Ala Ala 
145 150 155 160 

Ser Glu Glu Val Val Arg Gly Val Val Leu Arg Leu Pro Thr Val Tyr 
165 170 175 

Gly Arg Ser Pro Leu Thr Gly Trp Thr Gly Arg Gly Val Val Ala Ser 
180 185 190 

Val Ala Arg Gin Ala Val Ser Gly Glu Pro Val Thr Met Trp His Asp 
195 200 205 
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Gly Thr Val Gly Arg Asp Leu Leu His Val Glu Asp Ala Ala Arg Ala 
210 215 220 

Phe Ala Ala Ala Leu Gly His Val Glu Arg Leu Asp Gly Gly Thr Trp 
225 230 235 240 

Ser Val Gly Thr Gly Arg Leu Glu Pro Leu Gly Glu Val Phe Ser Ala 
245 250 255 

Leu Ala Gly Leu Val Ala Glu Arg Thr Gly Arg Pro Pro Val Pro Val 
260 265 270 

Val Ser Thr Glu Pro Pro Asp His Ala Glu Ala Gly Asp Phe Glu Ser 
275 280 285 

Ala Val Cys Asp Pro Ser Ala Phe Arg Ala Val Thr Gly Trp Ser Pro 
290 295 300 

Leu Val Pro Leu Arg Ala Gly Leu Gly Ala Val Val Glu Thr Met Val 
305 310 315 320 

Ala Asp Gly Ala Arg Gly Gly He Arg Thr 
325 330 



<210> 74 
<211> 1008 
<212> ADN 

<213> Streptomyces ambof aciens 

<220> 

<221> CDS 

<222> (1) . . (1008) 

<400> 74 

gtg age acg gac egg gag cag gee gcg cac acg egg etc ggt cgc age 48 
Val Ser Thr Asp Arg Glu Gin Ala Ala His Thr Arg Leu Gly Arg Ser 
1 5 10 15 

gcg ace ctg gtg age egg etc tgg ctg ggc ace gtg aac ttc age ggc 9 6 
Ala Thr Leu Val Ser Arg Leu Trp Leu Gly Thr Val Asn Phe Ser Gly 
20 25 30 

egg gtc gag gac ggt gae geg atg eag ctg atg gag gcg gcg gtc gae 144 
Arg Val Glu Asp Gly Asp Ala Met Gin Leu Met Glu Ala Ala Val Asp 
35 40 45 

cgc ggc ate aac tgc ate gac acc gcg gac ate tac ggc tgg egg ate 192 
Arg Gly He Asn Cys He Asp Thr Ala Asp lie Tyr Glv Trp Arg He 
5 0 55 60 

cac aag ggc cac acc gag gaa ctg gtg ggc egg tgg ctg gee aag age 24 0 
His Lys Gly His Thr Glu Glu Leu Val Gly Arg Trp Leu Ala Lys Ser 
65 70 75 80 

gec gcg egg egg gag gac gtc ctg ctg gee acc aag gtc ggc ggg gac 288 
Ala Ala Arg Arg Glu Asp Val Leu Leu Ala Thr Lys Val Gly Gly Asp 
85 90 ' 95 



atg age gaa egg etc aac gac ggc ggc ctg teg gcg egg cac ate gtc. 



336 
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480 



528 



Met Ser Glu Arg Leu Asn Asp Gly Gly Leu Ser Ala Arg His He Val 
100 105 HO 

acg gcc tgc gag cag teg ctg egg cgc ctg ggc gtg gac cac ate gac 3 84 
Thr Ala Cys Glu Gin Ser Leu Arg Arg Leu Gly Val Asp His He Asp 
115 120 125 

ctg tac cag atg cac cgc gtc gac cac gcc gcg ccg tgg gac gag ate 432 
Leu Tyr Gin Met His Arg Val Asp His Ala Ala Pro Trp Asp Glu He 
130 135 140 

tgg cag gcg atg gac cgt ctg gtg gcg age ggc aag gtg acc tac gtg 
Trp Gin Ala Met Asp Arg Leu Val Ala Ser Gly Lys Val Thr Tyr Val 
145 150 155 160 

ggg teg teg aac ttc gcc ggc tgg aac gtc gcc gcc gcg cag gac gcg 
Glv Ser Ser Asn Phe Ala Gly Trp Asn Val Ala Ala Ala Gin Asp Ala- 
165 170 175 

gcc egg egg cgc cag tec etc ggt ctg gtg tec gag cag tgc ctg tac 57 6 
Ala Arg Arg Arg Gin Ser Leu Gly Leu Val Ser Glu Gin Cys Leu Tyr 
180 185 190 

aac ctg gcg gtg cgc cac gcc gag ctg gaa ctg ctg ccg gcc gcc cag 624 
Asn Leu Ala Val Arg His Ala Glu Leu Glu Leu Leu Pro Ala Ala Gin 
195 200 205 

gcg tac gga ctg ggc gtg ttc gcc tgg teg ccg ctg cac ggc ggg ctg 672 
Ala Tyr Gly Leu Gly Val Phe Ala Trp Ser Pro Leu His Gly Gly Leu 
210 . 215 220 

etc age ggg gtg ctg cgc aag etc gcg gcg ggc gtc gcg gtg aag teg 
Leu Ser Gly Val Leu Arg Lys Leu Ala Ala Gly Val Ala Val Lys Ser 
225 230 235 240 



720 



gca cag ggg egg gcc cag ctg ctg ctg ccc gag ctg cgc gcg acg ate 768 
Ala Gin Gly Arg Ala Gin Leu Leu Leu Pro Glu Leu Arg Ala Thr He 
245 250 255 

gag gcg tac gag ggg ttc tgc ggc egg ate ggc gcg gat ccg gcc gag 
Glu Ala Tyr Glu Gly Phe Cys Gly Arg He Gly Ala Asp Pro Ala Glu 
260 265 270 

gtc ggt ctg gcc tgg gtg ctg tec egg ccg ggg ate age ggc gcg gtg 
Val Gly Leu Ala Trp Val Leu Ser A-rg Pro Gly He Ser Gly Ala Val 
275 280 285 

ate ggt ccg cgc acg gtg gac cag ctg gac teg gcg ctg egg tec ctg 
He Gly Pro Arg Thr Val Asp Gin Leu Asp Ser Ala Leu Arg Ser Leu 
290 295 300 

gac ctg gtc etc ggg gag gcc gaa ctg gcc gag ctg gac gcc ate ttc 
Asp Leu Val Leu Gly Glu Ala Glu Leu Ala Glu Leu Asp Ala He Phe 
305 310 315 320 

ccg ccc ctg ggc aag ggc ggc egg gcg ccg gac gcg tgg ate age tga 
Pro Pro Leu Gly Lys Gly Gly Arg Ala Pro Asp Ala Trp He Ser 
325 330 335 



816 



864 



912 



960 



1008 
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<211> 335 
<212> PRT 

<213> Streptomyces ambofaciens 



<400> 75 

vax oci 
1 




5 10 



Axy StixT 
15 



-Ala Thr Leu -Val Ser Arg Leu Trp Leu Gly Thr Val Asn Phe Ser- -Gly 
20 25 30 

Arg Val Glu Asp Gly Asp Ala Met Gin Leu Met Glu Ala Ala Val Asp 
35 40 45 

Arg Gly lie Asn Cys lie Asp Thr Ala Asp He Tyr Gly Trp Arg He 
50 55 60 

His Lys Gly His Thr Glu Glu Leu Val Gly Arg Trp Leu Ala Lys Ser 
65 70 75 80 

Ala Ala Arg Arg Glu Asp Val Leu Leu Ala Thr Lys Val Gly Gly Asp 



Thr Ala Cys Glu Gin Ser Leu Arg Arg Leu Gly Val Asp His He Asp 
115 120 125 

Leu Tyr Gin Met His Arg Val Asp His Ala Ala Pro Trp Asp Glu He 
130 135 140 

Trp Gin Ala Met Asp Arg Leu Val Ala Ser Gly Lys Val Thr Tyr Val 
145 150 155 160 

Gly Ser Ser Asn Phe Ala Gly Trp Asn Val Ala Ala Ala Gin Asp Ala 
165 170 175 

Ala Arg Arg Arg Gin Ser Leu Gly Leu Val Ser Glu Gin Cys Leu Tyr 
180 185 190 

Asn Leu Ala Val Arg His Ala Glu Leu Glu Leu Leu Pro Ala Ala Gin 
195 200 205 

Ala Tyr Gly Leu Gly Val Phe Ala Trp Ser Pro Leu His Gly Gly Leu 
210 215 220 

Leu Ser Gly Val Leu Arg Lys Leu Ala Ala Gly Val Ala Val Lys Ser 
225 230 235 240 

Ala Gin Gly Arg Ala Gin Leu Leu Leu Pro Glu Leu Arg Ala Thr He 
245 250 255 

Glu Ala Tyr Glu Gly Phe Cys Gly Arg He Gly Ala Asp Pro Ala Glu 
260 265 270 

Val Gly Leu Ala Trp Val Leu Ser Arg Pro Gly He Ser Gly Ala Val 
275 280 285 

He Gly Pro Arg Thr Val Asp Gin Leu Asp Ser Ala Leu Arg Ser Leu 
290 295 300 



85 



90 



95 



Met Ser Glu Arg 
100 



Leu Asn Asp Gly Gly Leu Ser Ala Arg His 
105 110 



He Val 
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Asp Leu Val Leu Gly Glu Ala Glu Leu Ala Glu Leu Asp Ala lie Phe 

305 310 315 320 

Pro Pro Leu Gly Lys Gly Gly Arg Ala Pro Asp Ala Trp lie Ser 
325 330 335 



<210> 76 
<211> 1233 
<212> ADN 

<213> Streptomyces ambofaciens 

<220> 

<221> CDS 

<222> (1) . . (1233) 

<400> 76 

atg att gcc acc gcg tgc cgc gtc tgc ggc aac aag gag ctg etc tec 

Met lie Ala Thr Ala Cys Arg Val Cys Gly Asn Lys Glu Leu Leu Ser 
15 10 15 

gta etc gac ctg ggc gaa cag gcg etc acc ggg gtg ttc ccg gcc gac 
Val Leu Asp Leu Gly Glu Gin Ala Leu Thr Gly Val Phe Pro Ala Asp 
20 25 30 



acg etc etc aag ggc tac ccc gcc gac ggc ccg cga ctg gtc ggc ate 
Thr Leu Leu Lys Gly Tyr Pro Ala Asp Gly Pro Arg Leu Val Gly lie 
115 120 125 



gcg egg egg gcg aag gcc gtc acc tec ate gcg atg ttc tac gac ctg 
Ala Arg Arg Ala Lys Ala Val Thr Ser lie Ala Met Phe Tyr Asp Leu 



48 



96 



cgc gac gag gtc gtg ccg teg gtc ccg ctg gaa etc gtc gcg tgt tec 144 
Arg Asp Glu Val Val Pro Ser Val Pro Leu Glu Leu Val Ala Cys Ser 
35 40 45 

ccg gcc gga tgc ggc etc gtg caa ctg cgc cac acc ccc gac' ccg gac 192 
Pro Ala Gly Cys Gly Leu Val Gin Leu Arg His Thr Pro Asp Pro Asp 
50 55 60 

etc atg tac ggc gag ggc tac ggc tac cgc teg ggc ate egg ccc ttc 
Leu Met Tyr Gly Glu Gly Tyr Gly Tyr Arg Ser Gly He Arg Pro Phe 
65 70 75 80 

atg gtc gac cac ctg cat ggc aag gtc gcc gcc gtc cgc egg ctg gtg 
Met Val Asp His Leu His Gly Lys Val Ala Ala Val Arg Arg Leu Val 
85 90 95 



240 



288 



gac etc ggc ccg gac gac ctg gtc etc gac ate ggc age aac gac gcc 33 6 
Asp Leu Gly Pro Asp Asp Leu Val Leu Asp He Gly Ser Asn Asp Ala 
100 105 HO 



384 



gac ccg acc ggc ggc aag ttc cgc gac ctg tac ccg ccg aac gcc gag 43 2 

Asp Pro Thr Gly Gly Lys Phe Arg Asp Leu Tyr Pro Pro Asn Ala Glu 

130 " 135 140 

ttg gtc gtg gac tac ttc acc cgc gcg acc ttc gag aac cgc ttc ggg 

Leu Val Val Asp Tyr Phe Thr Arg. Ala Thr Phe Glu Asn Arg Phe Gly 
1*5 150 155 160 



480 



528 
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165 170 175 

ccg gac ccg ctg cgc ttc atg age gac gtc cgc gac gtc etc gec gag 576 
Pro Asp Pro Leu Arg Phe Met Ser Asp Val Arg Asp Val Leu Ala Glu 
180 185 190 

gac ggc gtc tgg atg atg gag cag age tac ctg ccc gee atg etc gaa 624 
Asp Gly Val Trp Met Met Glu Gin Ser Tyr Leu Pro Ala Met Leu Glu 

195 _ 200 205. 

gec gac gcg tac gac ate gtc tgc cac gag cac ctg gag tac tac gcg 672 
Ala Asp Ala Tyr Asp He Val Cys His Glu His Leu Glu Tyr Tyr Ala 
210 215 220 

ctg cgc cag ate gag tgg atg gcg gaa cgc gtc ggc etc acc gtc ate 720 
Leu Arg Gin He Glu Trp Met Ala Glu Arg Val Gly Leu Thr Val He 
225 230 235 240 

egg gec gag etc acc gag gtg tac ggc ggc age ctg tgc gtc acg etc 768 
Arg Ala Glu Leu Thr Glu Val Tyr Gly Gly Ser Leu Cys Val Thr Leu 
245 250 255 

gec agg acc ggt tec egg cac ccg agg gac gag gcg ggc ctg gec cgc 816 
Ala Arg Thr Gly Ser Arg His Pro Arg Asp Glu Ala Gly Leu Ala Arg 
260 265 270 

ate egg gee gee gag gee gec gcg gga ctg gac ggc atg gca ccg ttc 864 
lie Arg Ala Ala Glu Ala Ala Ala Gly Leu Asp Gly Met Ala Pro Phe 
275 280 285 

gag gee ttc gee cgc cgc gtc gee gac cag egg gac gee ctg cgc ggc 912 
Glu Ala Phe Ala Arg Arg Val Ala Asp Gin Arg Asp Ala Leu Arg Gly 
290 295 300 

ttc ctg gac cgc tec cgc caa gag ggc ctg ctg acc etc ggg tac ggc 960 
Phe Leu Asp Arg Ser Arg Gin Glu Gly Leu Leu Thr Leu Gly Tyr Gly 
305 310 315 320 

gee tec acc aag ggc aac gtc ate etc cag tac tgc ggg ate acc gaa 1008 
Ala Ser Thr Lys Gly Asn Val He Leu Gin Tyr Cys Gly He Thr Glu 
325 330 335 

egg gac ctg ccg tgc ate ggc gag gtg age gag gag aag gcg ggg cgt 1056 
Arg Asp Leu Pro Cys He Gly Glu Val Ser Glu Glu Lys Ala Gly Arg 
340 345 350 

ttc acc ccc ggg acg ggc ate ccc ate gtg tec gag gag gac gcg aag 1104 
Phe Thr Pro Gly Thr Gly He Pro He Val Ser Glu Glu Asp Ala Lys 
355 360 365 

gcg cag aag ccg gac cag ttg ctg gtc ctg ccc tgg ate tac egg gac 1152 
Ala Gin Lys Pro Asp Gin Leu Leu Val Leu Pro Trp He Tyr Arg Asp 
370 375 380 

ggg ttc gtc gaa egg gag egg gag ttc etc gac ggc ggc ggc cga ctg 12 00 
Gly Phe Val Glu Arg Glu Arg Glu Phe Leu Asp Gly Gly Gly Arg Leu 
385 390 395 400 

gtc ttc ccg ctg ccc gcg etc gac gtc gtg tga 1233 
Val Phe Pro Leu Pro Ala Leu Asp Val Val 
405 410 
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<210> 77 

<211> 410 

<212> PRT 

<213> Strep tomyces 



ambof aciens 



<400> 77 
Met lie Ala Thr 
1 

Val Leu Asp Leu 
20 

Arg Asp Glu Val 
35 

Pro Ala Gly Cys 
50 

Leu Met Tyr Gly 
65 

Met Val Asp His 



Asp Leu Gly Pro 
100 

Thr Leu Leu Lys 
115 



Ala Cys Arg Val 
5 

Gly Glu Gin Ala 



Val Pro Ser Val 
40 

Gly Leu Val Gin 
55 

Glu Gly Tyr Gly 
70 

Leu His Gly Lys 
85 

Asp Asp Leu Val 



Gly Tyr Pro Ala 
120 



Cys Gly Asn Lys 
10 

Leu Thr Gly Val 
25 

Pro Leu Glu Leu 



Leu Arg His Thr 
60 

Tyr Arg Ser Gly 
75 

Val Ala Ala Val 
90 

Leu Asp lie Gly 
105 

Asp Gly Pro Arg 



Glu Leu Leu Ser 
15 

Phe Pro Ala Asp 
30 

Val Ala Cys Ser 
45 

Pro Asp Pro Asp 



lie Arg Pro Phe 
80 

Arg Arg Leu Val 
95 

Ser Asn Asp Ala 
110 

Leu Val Gly lie 
125 



Asp Pro Thr Gly 
130 

Leu Val Val Asp 
145 

Ala Arg Arg Ala 



Pro Asp Pro Leu 
180 

Asp Gly Val Trp 
195 



Gly Lys Phe Arg 
135 

Tyr Phe Thr Arg 
150 

Lys Ala Val Thr 
165 

Arg Phe Met Ser 



Met Met Glu Gin 
200 



Asp Leu Tyr Pro 
140 

Ala Thr Phe Glu 
155 

Ser lie Ala Met 
170 

Asp Val Arg Asp 
185 

Ser Tyr Leu Pro 



Pro Asn Ala Glu 



Asn Arg Phe Gly 
160 

Phe Tyr Asp Leu 
175 

Val Leu Ala Glu 
190 

Ala Met Leu Glu 
205 



Ala Asp Ala Tyr Asp lie Val Cys His Glu His Leu Glu Tyr Tyr Ala 
210 215 220 

Leu Arg Gin lie Glu Trp Met Ala Glu Arg Val Gly Leu Thr Val lie 
225 230 235 240 



Arg Ala Glu Leu Thr Glu Val Tyr 
245 

Ala Arg Thr Gly Ser Arg His Pro 
260 

He Arg Ala Ala Glu Ala Ala Ala 
275 280 



Gly Gly Ser Leu Cys Val Thr Leu 
250 255 

Arg Asp Glu Ala Gly Leu Ala Arg 
265 270 

Gly Leu Asp Gly Met Ala Pro Phe 
285 
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Glu Ala Phe Ala Arg 
290 

Phe Leu Asp Arg Ser 
305 

Ala Ser Thr Lys Gly 
325 

Arg Asp Leu Pro Cys 
340 

Phe Thr Pro Gly Thr 
355 

Ala Gin Lys Pro Asp 
370 

Gly Phe Val Glu Arg 
385 

Val Phe Pro Leu Pro 
405 



Arg Val Ala Asp Gin Arg 
295 

Arg Gin Glu Gly Leu Leu 
310 315 

Asn Val lie Leu Gin Tyr 
330 



lie Gly Glu Val Ser Glu 
345 

Gly He Pro He Val Ser 
360 

Gin Leu Leu Val Leu Pro 
375 

Glu Arg Glu Phe Leu Asp 
390 395 

Ala Leu Asp Val Val 
410 



Asp Ala Leu Arg Gly 
300 

Thr Leu Gly Tyr Gly 
320 

Cys Gly He Thr Glu 
335 



Glu Lys Ala Gly Arg 
350 

Glu Glu Asp Ala Lys 
365 

Trp He Tyr Arg Asp 
380 

Gly Gly Gly Arg Leu 
400 



<210> 78 
<211> 1116 
<212> ADN 

<213> Streptomyces ambofaciens 

<220> 

<221> CDS 

<222> (1) . . (1116) 

<400> 78 

gtg cac egg gac aac gec gec gag ccg ttg gtc aaa tgc ctg gtc tgg 4 8 

Val His Arg Asp Asn Ala Ala Glu Pro Leu Val Lys Cys Leu Val Trp 
15 10 15 

gac ctg gac aac acc etc tgg cag ggc acc etc etc gag gag gac gag 96 
Asp Leu Asp Asn Thr Leu Trp Gin Gly Thr Leu Leu Glu Glu Asp Glu 
20 25 v 30 

gtc egg etc gec ccg gac gtc ctg egg acc ate acc gag ctg gac gcg 144 
Val Arg Leu Ala Pro Asp Val Leu Arg Thr He Thr Glu Leu Asp Ala 
35 40 45 

cgc ggc ate ctg cag gcg gtg gec age aag aac gac cac gat cac gee 192 
Arg Gly He Leu Gin Ala Val Ala Ser Lys Asn Asp His Asp His Ala 
50 55 60 

tgg gcg aag etc gaa cag etc ggc gtc gec gag tac ttc gtg etc ccg 240 
Trp Ala Lys Leu Glu Gin Leu Gly Val Ala Glu Tyr Phe Val Leu Pro 
65 70 75 80 

agg ate ggc tgg ggc ccg aag teg aag teg gtc cgc gag ate gee gac 288 
Arg He Gly Trp Gly Pro Lys Ser Lys Ser Val Arg Glu He Ala Asp 
85 90 95 
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egg ctg aac ttc gcg ccg age ace etc gee ttc ate gac gac cag ccc 336 
Arg Leu Asn Phe Ala Pro Ser Thr Leu Ala Phe lie Asp Asp Gin Pro 
100 105 110 

ttc gaa egg gec gag gtc ace cac gaa ctg ccg gag gtc cgc acc tac 3 84 
Phe Glu Arg Ala Glu Val Thr His Glu Leu Pro Glu Val Arg Thr Tyr 
115 120 125 

gec gec gag cag gcg acc egg ctg acc ggc etc ccg gag ttc age ccg 432 
Ala Ala Glu Gin Ala Thr Arg Leu Thr Gly Leu Pro Glu Phe Ser Pro 
130 135 140 

ggc acc gtc acc gtc gac teg acc cgc cgc cgc tec atg tac cag gcg 480 
Gly Thr Val Thr Val Asp Ser Thr Arg Arg Arg Ser Met Tyr Gin Ala 
145 150 155 160 

tec ttc cgc egg gac gec gag egg tec gac ttc acc gga ccc gac gcg- 528 
Ser Phe Arg Arg Asp Ala Glu Arg Ser Asp Phe Thr Gly Pro Asp Ala 
165 170 175 

gac ttc ctg cgc teg ctg gac ate egg atg egg ate age cgc gec acg 576 
Asp Phe Leu Arg Ser Leu Asp lie Arg Met Arg lie Ser Arg Ala Thr 
180 185 190 

ccc ctg gag ctg teg egg gtc gag gaa ctg acc ctg cgc acc age cag 62 4 
Pro Leu Glu Leu Ser Arg Val Glu Glu Leu Thr Leu Arg Thr Ser Gin 
195 200 205 

atg aac gee acc gga gtg cac tac tec gag gac gag ctg cgc gec etc 672 
Met Asn Ala Thr Gly Val His Tyr Ser Glu Asp Glu Leu Arg Ala Leu 
210 ' 215 220 

ate gac gac ccc gac cac gag gtg ctg gtc acc acc gtc acc gat cgc 720 
lie Asp Asp Pro Asp His Glu Val Leu Val Thr Thr Val Thr Asp Arg 
225 230 235 240 

ttc ggt ccc tac ggc gcg gtc ggc gtc gtg ctg ctg egg cgc ggc ccc 7 68 
Phe Gly Pro Tyr Gly Ala Val Gly Val Val Leu Leu Arg Arg Gly Pro 
245 250 255 

gag gee tgg egg ate aag ctg ctg gec acc teg tgc egg gtg gtg teg 816 
Glu Ala Trp Arg lie Lys Leu Leu Ala Thr Ser. Cys Arg Val Val Ser 
260 265 270 

ctg ggg gec ggc acg gtg ate ctg cgc tgg etg acg gac cag gcg cac 864 
Leu Gly Ala Gly Thr Val lie Leu Arg Trp Leu Thr Asp Gin Ala His 
275 280 285 

egg gec ggg gtg cac etc gga gec gac ttc egg gec acc gaa cgc aac 912 
Arg Ala Gly Val His Leu Gly Ala Asp Phe Arg Ala Thr Glu Arg Asn 
290 295 300 

egg atg atg gaa gtg gec tac cgc ttc gee gga ttc acc gac gat ccc 960 
Arg Met Met Glu Val Ala Tyr Arg Phe Ala Gly Phe Thr Asp Asp Pro 
305 310 315 320 

tgc ccg tgc cag gac gee tec gec gec acc ggc gcg ate ggc cgc ctg 1008 
Cys Pro Cys Gin Asp Ala Ser Ala Ala Thr Gly Ala He Gly Arg Leu 
: 325 330 335 



cac ctg gtg ccg tec ccc egg ccc gec ccc gac acc etc cgt ctg gaa 



1056 
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His Leu Val Pro Ser Pro 
340 

get ccc gac ctg gec acg 
Ala Pro Asp Leu Ala Thr 
355 

agg acc cca tga 
Arg" Thr Pro " 
370 



Arg Pro Ala Pro Asp Thr 
345 

ggc egg egg cgc ceo ggc 
Gly Arg Arg Arg Pro Gly 
360 



Leu Arg Leu Glu 
350 

cag gat ccc gaa 1104 

Gin Asp Pro Glu 

365 

1116 



<210> 79 
<211> 371 
<212> PRT 

<213> Streptoroyces ambofaciens 
<400> 79 

Val His Arg Asp Asn Ala Ala Glu Pro Leu Val Lys Cys Leu Val Trp 
15 10 15 

Asp Leu Asp Asn Thr Leu Trp Gin Gly Thr Leu Leu Glu Glu Asp Glu 
20 25 30 

Val Arg Leu Ala Pro Asp Val Leu Arg Thr lie Thr Glu Leu Asp Ala 
35 40 45 

Arg Gly lie Leu Gin Ala Val Ala Ser Lys Asn Asp His Asp His Ala 
50 55 60 

Trp Ala Lys Leu Glu Gin Leu Gly Val Ala Glu Tyr Phe Val Leu Pro 
65 70 75 80 

Arg lie Gly Trp Gly Pro Lys Ser Lys Ser Val Arg Glu lie Ala Asp 
85 90 95 

Arg Leu Asn Phe Ala Pro Ser Thr Leu Ala Phe lie Asp Asp Gin Pro 
100 105 110 

Phe Glu Arg Ala Glu Val Thr His Glu Leu Pro Glu Val Arg Thr Tyr 
115 120 125 

Ala Ala Glu Gln^ Ala Thr Arg Leu Thr Gly Leu Pro Glu Phe Ser Pro 
130 135 140 

Gly Thr Val Thr Val Asp Ser Thr Arg Arg Arg Ser Met Tyr Gin Ala 
145 150 155 160 

Ser Phe Arg Arg Asp Ala Glu Arg Ser Asp Phe Thr Gly Pro Asp Ala 
165 170 175 

Asp Phe Leu Arg Ser Leu Asp He Arg Met Arg He Ser Arg Ala Thr 
180 185 190 

Pro Leu Glu Leu Ser Arg Val Glu Glu Leu Thr Leu Arg Thr Ser Gin 
195 200 205 

Met Asn Ala Thr Gly Val His Tyr Ser Glu Asp Glu Leu Arg Ala Leu 
210 215 220 

He Asp Asp Pro Asp His Glu Val Leu Val Thr Thr Val Thr Asp Arg 



{ 
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225 230 235 240 

Phe Gly Pro Tyr Gly Ala Val Gly Val Val Leu Leu Arg Arg Gly Pro 
245 250 255 

Glu Ala Trp Arg lie Lys Leu Leu Ala Thr Ser Cys Arg Val Val Ser 
260 265 270 

Leu Gly Ala Gly Thr Val lie Leu Arg Trp Leu Thr Asp Gin Ala His 
275 280 285 

Arg Ala Gly Val His Leu Gly Ala Asp Phe Arg Ala Thr Glu Arg Asn 
290 295 300 

Arg Met Met Glu Val Ala Tyr Arg Phe Ala Gly Phe Thr Asp Asp Pro 
305 310 315 320 

Cys Pro Cys Gin Asp Ala Ser Ala Ala Thr Gly Ala He Gly Arg Leu 
325 330 335 

His Leu Val Pro Ser Pro Arg Pro Ala Pro Asp Thr Leu Arg Leu Glu 
340 345 350 

Ala Pro Asp Leu Ala Thr Gly Arg Arg Arg Pro Gly Gin Asp Pro Glu 
355 360 365 



Arg Thr Pro 
370 



<210> 80 
<211> 1122 
<212> ADN 

<213> Streptomyces ambofaciens 

<220> 

<221> CDS 

<222> (1) . . (1122) 

<400> 80 

gtg get gac acc tec cac gee gac ggc ace gag gee gag gag ctg ttc 48 

Val Ala Asp Thr Ser His Ala Asp Gly Thr Glu Ala Glu Glu Leu Phe 
15 10 15 

acc gcg ctg gtc ggc gac egg gcg gec gag tgg gac egg acg ggc gag 9 6 
Thr Ala Leu Val Gly Asp Arg Ala Ala Glu Trp Asp Arg Thr Gly Glu 
20 25 30 

ctg ccc etc ggc ctg ctg cac gac etc ggc tec egg ggc ctg ctg tgc 144 
Leu Pro Leu Gly Leu Leu His Asp Leu Gly Ser Arg Gly Leu Leu Cys 
35 40 45 

gca cag gcg ccc gcg gtc cac ggc ggc etc ggc tgg acc age egg cgc 192 
Ala Gin Ala Pro Ala Val His Gly Gly Leu Gly Trp Thr Ser Arg Arg 
50 55 60 



aac ggc gaa etc acc gcg cac gtc ggc gee etc tgc age teg ttg egg 
Asn Gly Glu Leu Thr Ala His Val Gly Ala Leu Cys Ser Ser Leu Arg 
65 70 75 80. 



240 
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age gtc atg acc teg cag ggc atg gec gec tgg acg ctg cgc egg etc 2 88 
Ser Val Met Thr Ser Gin Gly Met Ala Ala Trp Thr Leu Arg Arg Leu 
85 90 95 

gee gga gcg gac cag cag gec tec ctg gtg ccc egg ttg acc ggc ggc 336 
Ala Gly Ala Asp Gin Gin Ala £i&~r r.^n v»i r>->-^ a-^ Tja ,, mi,^ ^.t,. 

_ — » — — ••- ^-i-j-vjj ijcu nil ^jj.y 

100 105 no 

gaa ctg gec gec gtg. gcg ttc acc gag gec. ggc. gee ggc age gac ctg 3 84 
Glu Leu Ala Ala Val Ala Phe Thr Glu Ala Gly Ala Gly Ser Asp Leu 
115 120 125 

tec gee ctg cgc acc cgc ate acc tec gac ggc gac gaa gtc gtc gtc 432 
Ser Ala Leu Arg Thr Arg lie Thr Ser Asp Gly Asp Glu Val Val Val 
130 135 140 



gac ggc gtc aag gtg tgg gcg acc aac gec gcg tac gcg gac ctg ctg 
Asp Gly Val Lys Val Trp Ala Thr Asn Ala Ala Tyr Ala Asp Leu Leu 
145 150 155 



480 



160 



gtg gtc ttc ggc cgc acg gag cag ggc gcg ggc gee gtc gtg gtg ccc 52 8 
Val Val Phe Gly Arg Thr Glu Gin Gly Ala Gly Ala Val Val Val Pro 
165 170 175 

gec teg gec ccc ggc gta cgc gtc gag cgc ate acc gac gcg cac ggc 57 6 
Ala Ser Ala Pro Gly Val Arg Val Glu Arg He Thr Asp Ala His Gly 
180 185 igo 

tgc cgc gcg gee gga cac gee gac ate cac ctg gac ggg gtc egg ctg 624 
Cys Arg Ala Ala Gly His Ala Asp He His Leu Asp Gly Val Arg Leu 
195 200 205 

ccg gca gac gee ctg etc cag ggc cac gac cgc acc ccc gee ctg ctg 672 
Pro Ala Asp Ala Leu Leu Gin Gly His Asp Arg Thr Pro Ala Leu Leu 
210 215 220 

gtc acc acc gcg ctg age tac ggc egg atg teg gtg gec tgg ggc tec 72 0 
val Thr Thr Ala Leu Ser Tyr Gly Arg Met Ser Val Ala Trp Gly Ser 
225 230 235 240 

ctg ggc ate ctg cgc gee tgc ctg gec gee gec gca cgt cac gec ggc 768 
Leu Gly He Leu Arg Ala Cys Leu Ala Ala Ala Ala Arg His Ala Gly 
245 250 255 

gga egg gag cag ttc ggc aeg egg etc teg gac cac eag cte gte gee 816 
Gly Arg Glu Gin Phe Gly Thr Arg Leu Ser Asp His Gin Leu Val Ala 
260 265 270 

egg cac etc gee gaa ctg ttc gtc gee gaa cag cac gee gee egg gcg 864 
Arg His Leu Ala Glu Leu Phe Val Ala Glu Gin His Ala Ala Arg A] a 
27 5 280 285 

tgc gag cac gee age gec cag tgg gac gag ggc age ccc gac atg atg 912 
Cys Glu His Ala Ser Ala Gin Trp Asp Glu Gly Ser Pro Asp Met Val 
290 295 300 

gtc gec gee gtc ctg gee aag cac gtc gcg gec acc ggc gec gca cac 960 
Val Ala Ala Val Leu Ala Lys His Val Ala Ala Thr Gly Ala Ala Arg 
305 310 315 ■ 320 

ggg gec gaa egg gee gtg cag gtg ctg gcg teg gec ggg gcg egg gag 1008 
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Gly Ala Glu Arg Ala Val Gin Val Leu Ala Ser Ala Gly Ala Arg Glu 
325 330 335 

gga cac gtc gtc gca egg gcg cac cgc gac gec aag etc atg gag ate 1056 
Gly His Val Val Ala Arg Ala His Arg Asp Ala Lys Leu Met Glu lie 
340 345 350 

ate gag ggc age aac gag ate tgc gaa ctg gtc ctg gee egg cac gtg 1104 
lie Glu Gly Ser Asn Glu lie Cys Glu Leu Val Leu Ala Arg His Val 
355 360 365 

atg tec gcg gee ggg tga 1122 
Met Ser Ala Ala Gly 
370 



<210> 81 
<211> 373 
<212> PRT 

<213> Streptomyces ambof aciens 
<400> 81 

Val Ala Asp Thr Ser His Ala Asp Gly Thr Glu Ala Glu Glu Leu Phe 
1 5 10 15 

Thr Ala Leu Val Gly Asp Arg Ala Ala Glu Trp Asp Arg Thr Gly Glu 
20 25 30 

Leu Pro Leu Gly Leu Leu His Asp Leu Gly Ser Arg Gly Leu Leu Cys 
35 40 45 

Ala Gin Ala Pro Ala Val His Gly Gly Leu Gly Trp Thr Ser Arg Arg 
50 55 . 60 

Asn Gly Glu Leu Thr Ala His Val Gly Ala Leu Cys Ser Ser Leu Arg 
65 70 75 80 

Ser Val Met Thr Ser Gin Gly Met Ala Ala Trp Thr Leu Arg Arg. Leu 
85 90 95 

Ala Gly Ala Asp Gin Gin Ala Ser Leu Val Pro Arg Leu Thr Gly Gly 
100 105 110 

Glu Leu Ala Ala Val Ala Phe Thr Glu Ala Gly Ala Gly Ser Asp Leu 
11-5 120 125 

Ser Ala Leu Arg Thr Arg lie Thr Ser Asp Gly Asp Glu Val Val Val 
130 135 140 

Asp Gly Val Lys Val Trp Ala Thr Asn Ala Ala Tyr Ala Asp Leu Leu 
145 150 155 160 

Val Val Phe Gly Arg Thr Glu Gin Gly Ala Gly Ala Val Val Val Pro 
165 - 170 175 

Ala Ser Ala Pro Gly Val Arg Val Glu Arg lie Thr Asp Ala His Gly 
180 185 190 



Cys Arg Ala Ala Gly His Ala Asp He His Leu Asp Gly Val Arg Leu 
195 200 205 
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Pro Ala Asp Ala Leu Leu Gin Gly His Asp Arg Thr Pro Ala Leu Leu 

210 215 220 

Val Thr Thr Ala Leu Ser Tyr Gly Arg Met Ser Val Ala Trp Gly Ser 

225 230 235 240 

Leu Gly He Leu Arg Ala Cys Leu Ala Ala Ala Ala Arg His Ala Gly 

245 250 255 



Gly Arg Glu Gin Phe Gly Thr Arg Leu Ser Asp His Gin Leu Val Ala 
260 265 270 

Arg His Leu Ala Glu Leu Phe Val Ala Glu Gin His Ala Ala Arg Ala 
275 280 285 

Cys Glu His Ala Ser Ala Gin Trp Asp Glu Gly Ser Pro Asp Met Val 
290 295 300 

Val Ala Ala Val Leu Ala Lys His Val Ala Ala Thr Gly Ala Ala Arg 
305 310 315 320 

Gly Ala Glu Arg Ala Val Gin Val Leu Ala Ser Ala Gly Ala Arg Glu 
325 330 335 

Gly His Val Val Ala Arg Ala His Arg Asp Ala Lys Leu Met Glu He 
340 345 350 

He Glu Gly Ser Asn Glu He Cys Glu Leu Val Leu Ala Arg His Val 
355 360 365 

Met Ser Ala Ala Gly 
370 



<210> 82 
<211> 312 
<212> ADN 

<213> Streptomyces ambofaciens 

<220> 

<221> CDS 

<222> (1) . . (312) 

<400> 82 

atg acc acg acg tec ggt egg ccc gac ccc acc ggc acg acc ccc acc 48 

Met Thr Thr Thr Ser Gly Arg Pro Asp Pro Thr Gly Thr Thr Pro Thr 
15 10 15 

gec gac gag gtc gec ggg gaa ctg etc ggg ttc etc gag gac cgc acc 9 6 
Ala Asp Glu Val Ala Gly Glu Leu Leu Gly Phe Leu Glu Asp Arg Thr 
20 25 30 

aag acc acc tgg gag cgc gac cag gac ctg ttc gec gtc ggc ggg atg 144 
Lys Thr Thr Trp Glu Arg Asp Gin Asp Leu Phe Ala Val Gly Gly Met 
35 40 45 

tec teg ctg ttc gec atg cag etc gtc gtg cac ctg gag aag acc tac 192 
Ser Ser Leu Phe Ala Met Gin Leu Val Val His Leu Glu Lys Thr Tyr 
50 55 60 
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ggc ate gtc ate age ggc gee gac ctg atg etc gac aac ttc cgc ace 240 

Gly He Val He Ser Gly Ala Asp Leu Met Leu Asp Asn Phe Arg Thr 
65 70 75 80 

gtc gac gcg atg gtc egg ctg gtc gga egg ctg gec gcg ccc ggc gag 

Val Asp Ala Met Val Arg Leu Val Gly Arg Leu Ala Ala Pro Gly Glu 
85 90 95 



288 



gcg ace ggg cac gca ggt ggc tga 312 
Ala Thr Gly His Ala Gly Gly 
100 



<210> 83 
<211> 103 
<212> PRT 

<213> Streptomyces ambofaciens 
<400> 83 

Met Thr Thr Thr Ser Gly Arg Pro Asp Pro Thr Gly Thr Thr Pro Thr 
15 10 15 

Ala Asp Glu Val Ala Gly Glu Leu Leu Gly Phe Leu Glu Asp Arg Thr 
20 25 3 0 

Lys Thr Thr Trp Glu Arg Asp Gin Asp Leu Phe Ala Val Gly Gly Met 
35 40 45 

Ser Ser Leu Phe Ala Met Gin Leu Val Val His Leu Glu Lys Thr Tyr 
50 . 55 60 

Gly He Val He Ser Gly Ala Asp Leu Met Leu Asp Asn Phe Arg Thr 
65 70 75 80 

Val Asp Ala Met Val Arg Leu Val Gly Arg Leu Ala Ala Pro Gly Glu 
85 90 95 

Ala Thr Gly His Ala Gly Gly 
100 



<210> 84 
<211> 867 
<212> ADN 

<213> Streptomyces ambofaciens 

<220> 

<221> CDS 

<222> (1) . . (867) 

<400> 84 

gtg ccc gat tec aag gaa aat tct ccg etc gtc gtg etc ggc gcg ggc 48 

Val Pro Asp Ser Lys Glu Asn Ser Pro Leu Val Val Leu Gly Ala Gly 
1^5 10 15 

gtc atg ggc acg gee ate gcg gca etc gee gtc gga cac ggg cac ccg 9 6 
Val Met Gly Thr Ala He Ala Ala Leu Ala Val Gly His Gly His Pro 
20 25 30 



gtc aca ctg gtc gac ace tec gee ggg gcg cgc gcg gee gee ccc gac 



144 
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Val Thr Leu Val Asp Thr Ser Ala Gly Ala Arg Ala Ala Ala Pro Asp 
35 40 45 

gcg gtc gcg ctg cat ctg egg acg gec egg ctg atg ggc gcg ctg ccc 192 
Ala Val Ala Leu His Leu Arg Thr Ala Arg Leu Met Gly Ala Leu Pro 
50 55 60 

cac gac cgc ccg ccc ggg gag ctg acc gtc gag gag gcg ccg gec gec 240 
His Asp Arg Pro Pro Gly Glu Leu Thr Val Glu Glu Ala Pro Ala Ala 
"65 " 70 75 80 

gtc gec acc gcg acc gec gtg ate gag gec gtc acc gag gac ccc gag 2 88 
Val Ala Thr Ala Thr Ala Val lie Glu Ala Val Thr Glu Asp Pro Glu 
85 90 95 

egg aag gee gag gtg ctg gcg gac ctg gcg tec gtg gcg cgc ccg ggg 336 
Arg Lys Ala Glu Val Leu Ala Asp Leu Ala Ser Val Ala Arg Pro Gly 
100 105 110 

acg ctg etc gtc age aac acc teg ggc gtc ccc ate gac gag ctg gee 3 84 
Thr Leu Leu Val Ser Asn Thr Ser Gly Val Pro lie Asp Glu Leu Ala 
115 120 125 

gac gee gtc ccc cgc ccc gag gac etc gtc ggc gtg cac ttc atg aac 432 
Asp Ala Val Pro Arg Pro Glu Asp Leu Val Gly Val His Phe Met Asn 
130 135 140 

ccc gcg tac gtg ate ccc acg gtc gag gtg gtc etc gga ccg cgc age 480 
Pro Ala Tyr Val lie Pro Thr Val Glu Val Val Leu Gly Pro Arg Ser 
145 150 155 160 

gga gag gcg gee gee egg gec acc egg gac ctg ctg tec ggc ctg ggc 52 8 
Gly Glu Ala Ala Ala Arg Ala Thr Arg Asp Leu Leu Ser Gly Leu Gly 
165 170 175 

cgc egg ggc ate gtc gtc ggc gac ggc gee ggc ttc gtg acc age cgc 576 
Arg Arg Gly He Val Val Gly Asp Gly Ala Gly Phe Val Thr Ser Arg 
180 185 190 

ctg ctg cac egg atg ctg aac gac gee ate gcg gtg gtg cac gag ggc 624 
Leu Leu His Arg Met Leu Asn Asp Ala He Ala Val Val His Glu Gly 
195 200 205 

egg gec acc ccg gag acc gtg gac gcg ctg atg cgc gac tgc ate ggc 672 
Arg Ala Thr Pro Glu Thr Val Asp Ala Leu Met Arg Asp Cys Il-e Gly 
210 215 220 

cac cgc acc gga ccc ctg gee acg gee gac ctg ate gga ctg gac aac 720 
His Arg Thr Gly Pro Leu Ala Thr Ala Asp Leu He Gly Leu Asp Asn 
225 230 235 240 

ctg gee gac teg ctg egg gtg atg cac gaa egg acc ggc gat ccg gcg 768 
Leu Ala Asp Ser Leu Arg Val Met His Glu Arg Thr Gly Asp Pro Ala 
245 250 255 

etc cgc ccg age gag ctg ctg ctg gac aag gtc cgc cag ggc ctg etc 816 
Leu Arg Pro Ser Glu Leu Leu Leu Asp Lys Val Arg Gin Gly Leu Leu 
260 265 270 



ggc cgc aag age ggc egg gga ttc tac gac tac cag gag gee acg cga 
Gly Arg Lys Ser Gly Arg Gly Phe Tyr Asp Tyr Gin Glu Ala Thr Arg 



864 
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275 



280 



285 



tga 



867 



<210> 85 
<211> 288 
<212> PRT 

<213> Streptomyces ambof aciens 
<400> 85 

Val Pro Asp Ser Lys Glu Asn Ser Pro Leu Val Val Leu Gly Ala Gly 
1 ~ 5 10 15 

Val Met Gly Thr Ala lie Ala Ala Leu Ala Val Gly His Gly His Pro 
20 25 30 

Val Thr Leu Val Asp Thr Ser Ala Gly Ala Arg Ala Ala Ala Pro Asp 
35 40 / 45 

Ala Val Ala Leu His Leu Arg Thr Ala Arg Leu Met Gly Ala Leu Pro 
50 55 60 

His Asp Arg Pro Pro Gly Glu Leu Thr Val Glu Glu Ala Pro Ala Ala ^ 
65 ~ ~ 70 75 80 

Val Ala Thr Ala Thr Ala Val lie Glu Ala Val Thr Glu Asp Pro Glu 
85 90. 95 

Arg Lys Ala Glu Val Leu Ala Asp Leu Ala Ser Val' Ala Arg Pro Gly 
100 105 110 

Thr Leu Leu Val Ser Asn Thr Ser Gly Val Pro lie' Asp Glu Leu Ala 
115 120 125 

Asp Ala Val Pro Arg Pro Glu Asp Leu Val Gly Val His Phe Met Asn ' 
130 135 140 

Pro Ala Tyr Val lie Pro Thr Val Glu Val Val Leu Gly Pro Arg Ser 
145 1 150 155 160 

Gly Glu Ala Ala Ala Arg Ala Thr Arg Asp Leu Leu Ser Gly Leu Gly 
165 170 175 

Arg Arg Gly He Val Val Gly Asp Gly Ala Gly Phe Val Thr Ser Arg 
180 185 190 

Leu Leu His Arg Met Leu Asn Asp Ala He Ala Val Val His Glu Gly 
195 200 205 

Arg Ala Thr Pro Glu Thr Val Asp Ala Leu Met Arg Asp Cys He Gly 
210 215 220 

His Arg Thr Gly Pro Leu Ala Thr Ala Asp Leu He Gly Leu Asp Asn 
225 ~ 230 235 240 

Leu Ala Asp Ser Leu Arg Val Met His Glu Arg Thr Gly Asp Pro Ala 
245 250 255 

Leu Arg Pro Ser Glu Leu Leu Leu Asp Lys Val Arg Gin Gly Leu Leu 
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260 



265 



270 



Gly Arg Lys Ser Gly Arg Gly Phe Tyr Asp Tyr Gin Glu Ala Thr Arg 
275 280 285 



<210> 86 

<211> 1040- — - - - ' 

<212> ADN 

<213> Streptomyces fradiae 
<400> 86 

ggcaggagcc acccgtgaca gggctgccgc ggcccgccgt ccgggtgccg ttccacgatc 60 
tgcgggacgt gcacgcggcc acgggggtgg agtcggagat cggcggcgcg ctgctgcgcg 120 
tcgccgcgcg cgggcgctat ctgctgggtg ccgaactcgc cgcgttcgag gagcggttcg 180 
ccgagtactg cggcaacgcc cactgtgtcg ccgtgggcag cgggctcgac gacgctcgtc 240 
tggcgctgtg ggcgctcggg gtgggcgagg gcgacgaggt gatcgtgccc tcgcacacgt 3 00 
tcatcgcgtc ctggctcgcg gtgtcggcga cgggtgccac cccggtgccg gtcgagcccg 3 60 
gtgatcccgg cgagccgggg cccggggcgt tcctgctcga cccggaccgg ctggaggccg 420 
cgctgacccc gcggaccagg gccgtgatgc ccgtgcatct ctacgggcac ccggtggatc 4 80 
tggacccggt cggggcgttc gcggagccgc acgggctggc cgtcgtggag gacgcggcgc 5 40 
aggccacggc ccgttaccgc gggaggcgga tcggcagcgg ccaccgcacg gcgttcagct 600 
tctacccggg gaagaacctg ggcgcgctcg gcgacggcgg tgccgtggtc acctcggacc 660 
cggaactcgc ggaccggctg cggctgttgc gcaactacgg cgcccgggag aagtaccggc 720 
acgaggagcg gggcaccaac tcccgcctgg acgagctgca ggcggccgtg ctgtcggtca 7 80 
agctgccgta cctggacgcc tggaacaccc gccgccggga gatcgccgcc cgctacggcg 840 
aggcgctggc cggtctgccg ggcgtcaccg tgccggaggg ccgcgtggcg gagccggtct 9 00 
ggcatcagta cgtgctgcgc agcccgtacc gcgaccggtt gcggcggcgg ctggccgagg 9 60 
cgggggtgga gaccctggtc cactatccgg tggccgtgca cgcgtcgggc gcgtacgcgg 102 0 
gcgcggggcc gtgtcccgcc 1040 



<210> 87 
<211> 388 
<212> PRT 

<213> Streptomyces fradiae 
<400> 87 

Met Thr Gly Leu Pro Arg Pro Ala Val Arg Val Pro Phe His Asp Leu 
15 10 15 

Arg Asp Val His Ala Ala Thr Gly Val Glu Ser Glu He Gly Gly Ala 
20 25 30 

Leu Leu Arg Val Ala Ala Arg Gly Arg Tyr Leu Leu Gly Ala Glu Leu 
35 40 45 

Ala Ala Phe Glu Glu Arg Phe Ala Glu Tyr Cys Gly Asn Ala His Cys 
50 55 60 

Val Ala Val Gly Ser Gly Leu Asp Asp Ala Arg Leu Ala Leu Trp Ala 
65 70 75 80 

Leu Gly Val Gly Glu Gly Asp Glu Val He Val Pro Ser His Thr Phe 
85 90 95 

He Ala Ser Trp Leu Ala Val Ser Ala Thr Gly Ala Thr Pro Val Pro 
100 105 110 



Val Glu Pro Gly Asp Pro Gly Glu Pro Gly Pro Gly Ala Phe Leu Leu 
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115 120 125 

Asp Pro Asp Arg Leu Glu Ala Ala Leu Thr Pro Arg Thr Arg Ala Val 
130 135 140 

Met Pro Val His Leu Tyr Gly His 'Pro Val Asp Leu Asp Pro Val Gly 
145 150 155 160 

Ala Phe Ala Glu Pro His Gly Leu Ala Val Val Glu Asp Ala Ala Gin 
165 170 175 

Ala Thr Ala Arg Tyr Arg Gly Arg Arg lie Gly Ser Gly His Arg Thr 
180 185 190 

Ala Phe Ser Phe Tyr Pro Gly Lys Asn Leu Gly Ala Leu Gly Asp Gly 
195 200 205 

Gly Ala Val Val Thr Ser Asp Pro Glu Leu Ala Asp Arg Leu Arg Leu 
210 ' 215 220 

Leu Arg Asn Tyr Gly Ala Arg Glu Lys Tyr Arg His Glu Glu Arg Gly 
225 " 230 235 240 

Thr Asn Ser Arg Leu Asp Glu Leu Gin Ala Ala Val Leu Ser Val Lys 
245 250 255 

Leu Pro Tyr Leu Asp Ala Trp Asn Thr Arg Arg Arg Glu lie Ala Ala 
260 265 270 

Arg Tyr Gly Glu Ala Leu Ala Gly Leu -Pro Gly Val Thr Val Pro Glu 
27 5 2 80 2 85 

Gly Arg Val Ala Glu Pro Val Trp His Gin Tyr Val Leu Arg Ser Pro 
290 295 300 

Tyr Arg Asp Arg Leu Arg Arg Arg Leu Ala Glu Ala Gly Val Glu Thr 
305 310 315 320 

Leu Val His Tyr Pro Val Ala Val His Ala Ser Gly Ala Tyr Ala Gly 
325 330 335 

Ala Gly Pro Cys Pro Ala Gly Gly Leu Pro Arg Ala Glu Arg Leu Ala 
340 345 350 

Gly Glu Val Leu Ser Leu Pro lie Gly Pro His Leu Pro Asp Glu Ala 
355 360 365 

Val Glu Val Val lie Ala Ala Val Gin Ser Ala Ala Leu Asp Ser Trp 
370 375 380 

Glu Glu Gly Pro 
385 



<210> 88 
<211> 271 
<212> PPvT 

<213> Streptomyces mycarof aciens 
<400> 88 
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Met Ser Pro lie Ser Ala Ser Ala Pro Ala Ala Ser Arg Ser Thr Ala 
15 10 15 

Arg Arg Glu Leu Gly Gin Asn Phe Phe Arg Ser Ala Ala Ala Ala Cys 
20 25 30 

Arg Phe Ser Asp Gin Leu Asp Ala Phe Cys Ala Asp Leu Pro Gly Ser 
35 40 45 



Leu Ala Asp Val Leu Thr Val Glu lie Gly Ala Gly Ser Gly Arg Val 
50 55 60 

Thr Lys Ala Leu Ala Ser Ala Gly Arg Ser Leu Leu Ala Val Glu lie 
65 70 75 80 

Asp Ala Tyr Trp Ala Arg Arg Leu Thr Ala Glu Ser Leu Pro Asp Val 
85 90 95 

Thr Val Val Asn Glu Asp Phe Leu Asn Leu Gin Leu Pro Arg Gin Pro 
100 105 110 

lie Arg Leu He Gly Asn Leu Pro Phe Val Ser Gly Thr Lys He Leu 
115 120 125 

Arg Arg Cys Leu Glu Leu Gly Pro Asn Arg Met Cys Gin Ala Val Phe 
130 135 140 

Leu Leu Gin Arg Glu Tyr Val Gly Lys Arg Thr Gly Ala Trp Gly Gly 
145 150 155 160 

Asn Leu Phe Asn Ala Gin Trp Glu Pro Trp Tyr Thr Phe Glu Gly Gly 
165 170 175 

Leu Ala Phe Ser Arg Asn Glu Phe Ser Pro Val Pro Arg Ala Asp Thr 
180 185 190 

Gin Thr Leu Val Val Met Pro Arg Arg Arg Pro Ser Val Pro Trp Arg 
195 200 205 

Glu Arg Thr Asp Tyr Gin Arg Phe Thr Gin Gin He Phe Asp Thr Gly 
210 215 220 

Gin Met Thr He Gly Glu Ala Ala Arg Lys Val Leu Arg Arg Gly His 
225 230 235 240 

Ala Gin Phe Val Arg Ser Ala Gly Val Arg Pro Ala Asp Arg Val Lys 
245 250 255 

Asp Leu Thr Val Arg Asp Trp Ala Ala Leu Phe Arg Ala Asn Pro 
260 265 270 



<210> 89 
<211> 25 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 
Oligonucleotide SRMR1 
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<400> 89 

ctgccagtcc tctcccagca gtacg 



25 



<210> 90 
<211> 25 
<212> AD3SF 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 
Oligonucleotide SRMR2 



<400> 90 

tgaagctgga cgtctcctac gtcgg 



25 



<210> 91 
<211> 2755 
<212> ADW 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: Cassette 
excisable 



<400> 91 

gatatctacc 

ttctcacctg 

tgtcacgcag* 

ccgcatgact 

atttttaaaa 

aaaggtcatt 

aagctctcgg 

gtgccgtgat 

gtgagttagc 

ttgtgtggaa 

gccaagctgc 

ccgcagcacc 

accgcggtgc 

tgtgaataga 

gatgattcct 

gccctggagg 

aaccccgtac 

ggtccggaga 

ccggtgcccc 

ccctacctgg 

accgaccgga 

cacagggtgc 

ctgctgcggg 

ccccggctgc 

cgcgaacccc 

gcgaccgagg 

agcctggtgc 

ctcgacgggg 

ttcctgcacg 

ccggaggaac 

cccgggccgc 

gggagccccg 

cggtgcgggc 



tcttcgtccc 
cggcgccagt 
ttagacactc 
gacagggatc 
taaaaaaggg 
caaaaggtca 
gtaacatcaa 
cgaaatccag 
tcactcatta 
ttgtgagcgg 
ggtggcgtac 
accgagaacg 
ggacaggccg 
ggtccgctgt 
acgcgagcct 
agctcgggct 
tggtcggcga 
gcctcgcgtc 
gcctcctcgg 
tgatgagccg 
acgcgctgct 
cgctgaccgg 
aacgccgcgc 
tggaccgcct 
ggttcgtcca 
tcaccgggat 
aactgcatct 
cgcagtggaa 
acttcgaggt 
tggcgcagtt 
ccggcgccgc 
ggcccgcgcc 
ccggcggcgg 



gaagcaactt 
ccatgggtgc 
accttcccac 
cctcgagaag 
gacctctagg 
tccaccggat 
ggcccgatcc 
atccttgacc 
ggcaccccag 
ataacaattt 
accgtcgcct 
tccccgacgt 
tgtcgcgacc 
gacacaagaa 
gcggaacgac 
gccggtgccg 
gcccgacccg 
ggagtcggag 
ccgcggcgag 
gatgaccggc 
cgccctggcc 
gaacaccgtg 
ggcgaccgtc 
ggaggactgg 
cggcgacctg 
cgtcgacttc 
caacgccttc 
gcggaccgag 
gttcgaggag 
cctctggggg 
ccccggcccc 
gaagcccgct 
acgctcagca 



gggtgggcgc 
tcgcggttgt 
gggcggtgtc 
ctttatgctt 
gtccccaatt 
caattcccct 
ttggagccct 
cgcagttgca 
gctttacact 
cacacaggaa 
cggtcggccc 
ggccgaccag 
ggccgtgcgg 
tccctgttac 
caggaattct 
ccggtgctgc 
gtgatcaagc 
gcgtacgcgg 
ctgcggcccg 
accacctggc 
cgcgaactcg 
ctcacccccc 
gaggaccacc 
ctgccggacg 
cacgggacca 
accgacgtct 
cggggcgacc 
gacttcgccc 
accccgctgg 
ccgccggaca 
cggcggccgc 
gctgcgagcc 
gcggcgggcg 



tcgaccttgg 
ccgccgctgt 
gtagggctcg 
gtaaaccgtt 
aattagtaat 
gctcgcgcag 
tgccctcccg 
aaccctcact 
ttatgcttcc 
acagctatga 
gtagagattg 
cccgtcatcg 
aattaagccg 
ttctcgaccg 
gggagccgct 
gggtgcccgg 
tgttcggcga 
tcctggcgga 
gcaccggagc 
ggtccgcgat 
gccgggtgct 
attccgaggt 
gcgggtgggg 
tggacacgct 
acatcttcgt 
atgcgggaga 
gcgagatcct 
gcgaactgct 
atctctccgg 
ccgcccccgg 
ccggagcccc 
cggagcgggc 
tgaaaggccc 



gccagtgtgc 
gcgctggcgt 
gctaagttgc 
ttgtgaaaaa 
ataatctatt 
gctgggtgcc 
cacgatgatc 
gatccgtaat 
ggctcgtatg 
ccatgattac 
gcgatcccga 
tcaacgcctg 
gcccgtaccc 
tattgattcg 
ggcccgccga 
cgagagcacc 
gcactggtgc 
cgccccggtg 
ctggccgtgg 
ggacggcacg 
cggccggctg 
cttcccggaa 
ctacctctcg 
gctggccggc 
ggacctggcc 
ctcccgctac 
ggccgcgctg 
cgccttcacc 
cttcaccgat 
cgcctgacgc 
gcccgcgctc 
cggccgacgg 
tggcatcctc 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1800 

1860 

1920 

1980 
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gatcatctcc tccagggtgg tcggccgagc ttccatccca gctcggcaag gatcgatccg 2040 

cgcagatcag ttggaagaat ttgtccacta cgtgaaaggc gagatcacca aggtagtcgg 2100 

caaataatgt ctaacaattc gttcaagccg acgccgcttc gcggcgcggc ttaactcaag 2160 

cgttagatgc actaagcaca taattgctca cagccaaact atcaggtcaa gtctgctttt 222 0 

attattttta agcgtgcata ataagcccta cacaaattgg gagatatatc atgaaaggct 2 280 

ggctttttct tgttatcgca atay t'cggcg aagtaatcgc aacatccgca LLaaaatcLa 2340 

gcgagggctt tactaagctg atccggtgga tgaccttttg aatgaccttt aatagattat 2400 

attactaatt aattggggac cctagaggtc ccctttttta ttttaaaaat tttttcacaa 2460 

-aacggtt-tac aagcataaag- cttgttaaca gatctcccgg- ctcgtcggac actccggtac 2 52 0 

ggccgtgact gaggaggtct accggaagca gatccggccc gtcatccaga ccggcgctgt 25 80 

ggtcatggac ggcatcttca agcggggtcc ggcgcgatag tcacgcagat agacacgcac 2 640 

agaaaacagg tgaggcagac cgtaacgtta cggtctgcct cacctggtgt ttctctgtcg 2700 

gggtggcggg atttgaaccc acgacctctt cgtcccgaac gaagcgcgcg atatc 2755 



<210> 92 

<211> 2208 

<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence 
excisable 

<400> 92 

gatatcgcgc gcgcttcgtt cgggacgaag 
cagagaaaca ccaggtgagg cagaccgtaa 
cgtgtctatc tgcgtgacta tcgcgccgga 
gcgccggtct ggatgacggg ccggatctgc 
ccggagtgtc cgacgagccg ggagatctgt 
tgaaaaaatt tttaaaataa aaaaggggac 
atctattaaa ggtcattcaa aaggtcatcc 
gggtgccaag ctctcgggta acatcaaggc 
gatgatcgtg ccgtgatcga aatccagatc 
ccggctcacg gtaactgatg ccgtatttgc 
cacgctgaaa atgccggcct ttgaatgggt 
gataagttta tcaccaccga ctatttgcaa 
atgtcatcag cggtggagtg caatgtcgtg 
ggtcagcttc tcaaccttgg ggttaccccc 
cgtagcgtcc ggcccctcga agatgggcca 
ctgggtccgg gagggacgct cgtcatgccc 
gatcctgcca cgtcgcccgt tacaccggac 
ctgccaaatg taaagcgcag cgcccatcca 
gagcagatca tctctgatcc attgcccctg 
cgtgtccatg aactcgatgg gcaggtactt 
acgctgcatc ttgccgagtt gatggcaaag 
attcttcagg atggcaagtt ggtacgcgtc 
cgctttgcct tggcggacag gtggctcaag 
ggtcatgcct ttgctcggtt gatccgctcc 
ctgggccgag atccgttgat cttcctgcat 
tgccgctcgc cagtcgattg gctgagctca 
caaggtcgcg ctgattgctg gggcaacacg 
aataatgtct aacaattcgt tcaagccgac 
ttagatgcac taagcacata attgctcaca 
tatttttaag cgtgcataat aagccctaca 
ctttttcttg ttatcgcaat agttggcgaa 
gagggcttta ctaagctgat ccggtggatg 
tactaattaa ttggggaccc tagaggtccc 
cggtttacaa gcataaagct tctcgaggga 
agccctacga caccgcccgt gggaaggtga 
agcggcggac aaccgcgagc acccatggac 



artificielle: Cassette 



aggtcgtggg ttcaaatccc gccaccccga 60 
cgttacggtc tgcctcacct gttttctgtg 12 0 
ccccgcttga agatgccgtc catgaccaca 180 
ttccggtaga cctcctcagt cacggccgta 240 
taacaagctt tatgcttgta aaccgttttg 300 
ctctagggtc cccaattaat tagtaatata 3 60 
accggatcaa ttcccctgct cgcgcaggct 42 0 
ccgatccttg gagcccttgc cctcccgcac 480 
cttgacccgc agttgcaaac cctcactgat 540 
agtaccagcg tacggcccac agaatgatgt 600 
tcatgtgcag ctccatcagc aaaaggggat 660 
cagtgccgtt gatcgtgcta tgatcgactg 72 0 
caatacgaat ggcgaaaagc cgagctcatc 7 80 
ggcggtgtgc tgctggtcca cagctccttc 840 
cttggactga tcgaggccct gcgtgctgcg 9 00 
tcgtggtcag gtctggacga cgagccgttc 960 
cttggagttg tctctgacac attctggcgc 102 0 
tttgcctttg cggcagcggg gccacaggca 1080 
ccacctcact cgcctgcaag cccggtcgcc 114 0 
ctcctcggcg tgggacacga tgccaacacg 1200 
gttccctatg gggtgccgag acactgcacc 12 60 
gattatctcg agaatgacca ctgctgtgag 1320 
gagaagagcc ttcagaagga aggtccagtc 13 80 
cgcgacattg tggcgacagc cctgggtcaa 1440 
ccgccagagg gcgggatgcg aagaatgcga 15 00 
tgagcggaga acgagatgac gttggagggg 15 60 
tgaaaggcga gatcaccaag gtagtcggca 162 0 
gccgcttcgc ggcgcggctt aactcaagcg 1680 
gccaaactat caggtcaagt ctgcttttat 1740 
caaattggga gatatatcat gaaaggctgg 1800 
gtaatcgcaa catccgcatt aaaatctagc 1860 
accttttgaa tgacctttaa tagattatat 1920 
cttttttatt ttaaaaattt tttcacaaaa 1980 
tccctgtcag tcatgcgggc aacttagccg 2 04 0 
gtgtctaact gcgtgacaac gccagcgcac 2100 
tggcgccgca ggtgagaagc acactggccc 216 0 
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aaggtcgagc gcccacccaa gttgcttcgg gacgaagagg cagatatc 



<210> 93 
<211> 60 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 
Oligonucleotide 0RF2A 

<400> 93 

cccgcgcggc agcctctccg tgatcgagtc cggcgtgacc atcgcgcgcg cttcgttcgg 6 



<210> 94 
<211> 60 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 
Oligonucleotide 0RF2B 

<400> 94 

gctccgtgcg tcatgcagga aggtgtcgta gtcgcggtag atctgcctct tcgtcccgaa 



<210> 95 - 
<211> 35 
<212> ADN 

<213> Sequence artificielle - 
<220> 

<223> Description de la sequence artificielle: Cicatrice 
att3 

<400> 95 

atcgcgcgcg cttcgttcgg gacgaagagg tagat 



<210> 96 
<211> 59 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 
Oligonucleotide EDR8 

<400> 96 

cgggatgatc gcttgtccgg cggccggatg cctagcctca tcgcgcgcgc ttcgttcgg 



<210> 97 
<211> 60 
<212> ADN 

<213> Sequence artificielle 



<220> 
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<223> Description de la sequence 
Oligonucleotide EDR9 

<400> 97 

cccgatccag aacgtctggt cggtgatcag 
<210> 98 

<211>. 60 . 

<212> ADN 

<213> Sequence artificielle 
<220> 

<22 3> Description de la sequence 
Oligonucleotide EDR3 

<400> 98 

accggggcgg tcctcccctc cggggcgtca 

<210> 99 
<211> 60 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence 
Oligonucleotide EDR4 

<400> 99 

cacgcagcga gccgacgcac tgatggacga 

<210> 100 
<211> 60 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence 
Oligonucleotide EDR5 

<400> 100 

gggcgtgaag cgggcgagtg tggatgtcat 

<210> 101 
<211> 60 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence 
Oligonucleotide EDR6 

<400> 101 

cgggaaacgg cgtcgcactc ctcgggggcc 



139 

artificielle : 



gtcgctgttc atctgcctct tcgtcccgaa 60 



artificielle : 



cggccgcgga atctgcctct tcgtcccgaa 60 



artificielle : 



cacgatggcc atcgcgcgcg cttcgttcgg 6 0 



artif icielle: 



gcgagtactc atcgcgcgcg cttcgttcgg 60 



artificielle: 



gcgtcagccc atctgcctct tcgtcccgaa 60 



<210> 102 
<211> 26 
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<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 
Oligonucleotide C9583 

<400> 102 

ctgcaggtgc tccagcgcgt cgatct 



<210> 103 
<211> 26 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 
Oligonucleotide C9584 

<400> 103 

ctgcagacgg aggcggacct gcggct 



<210> 104 
<211> 33 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: Cicatrice 
attl 

<400> 104 

atcgcgcgct tcgttcggga cgaagaggta gat 



<210> 105 
<211> 34 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: Cicatrice 
att2 

<400> 105 

atcggcgcgc ttcgttcggg acgaagaggt agat 34 



<210> 106 
<211> 10325 
<212> ADN 

<213> Streptomyces ainbofaciens 
<400> 106 

ctgcagaggg cgccgacgtg cgcggtgagt 
ccgccgtgga ccgcgggcgc ctgtgcgcac 
aggccgaggg gcagctcgcc cgtccggtcc 
gtgaacagct cctcggcctc ggtgccgtcg 
ggtcgcctcg ccgggcgcgg ccagccgtcc 



tcgccgttgc gccggctggt ccagccgagg 60 

agcaggcccc gggagccgag gtcgtgcagc 12 0 

cactcggccg cccggtcgcc gaccagcgcg 180 

gcgtgggagg tgtcagccac ctgcgtgccc 240 

gaccagccgg accatcgcgt cgacggtgcg 3 00 
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gaagttgtcg agcatcaggt cggcgccgct gatgacgatg ccgtaggtct tctccaggtg 360 

cacgacgagc tgcatggcga acagcgagga catcccgccg acggcgaaca ggtcctggtc 42 0 

gcgctcccag gtggtcttgg tgcggtcctc gaggaacccg agcagttccc cggcgacctc 480 

gtcggcggtg ggggtcgtgc cggtggggtc gggccgaccg gacgtcgtgg tcatcgcgtg 540 

gcctcctggt agtcgtagaa tccccggccg ctcttgcggc cgagcaggcc ctggcggacc 600 

i-\-rx\-r^/~>^rr/~T2, r*/^ r*rr*i 4- r-*^r ~ ~~~~ — t 4_ ._ „ . .. . . , _ . ^ *~ 

^ ^ w^^-^v.,^^ yv^v^uoy^u ^yyy^yy^y^ yuuyyatuyu uyy L.ccjy llc yuyCaccacc DDU 

cgcagcgagt cggccaggtt gtccagtccg atcaggtcgg ccgtggccag gggtccggtg 72 0 
eggtggccga tgcagtcgcg catcagcgcg tccacggtct ccggggtggc ccggccctcg 780 
• tgcaccaccg. cgatggcgtc -gttcagcate -cggfcgeagca-ggcggctggt cacgaagccg -840 
gcgccgtcgc cgacgacgat gccccggcgg cccaggccgg acagcaggtc ccgggtggcc 9 00 
cgggcggccg ■ cctctccgct gcgcggtccg aggaccacct cgaccgtggg gatcacgtac 960 
gcggggttca tgaagtgcac gccgacgagg tcctcggggc gggggacggc gtcggccagc 102 0 
tcgtcgatgg ggacgcccga ggtgttgctg acgagcagcg tccccgggcg cgccacggac 10 80 
gccaggtccg ccagcacctc ggccttccgc tcggggtcct cggtgacggc ctcgatcacg 1140 
gcggtcgcgg tggcgacggc ggccggcgcc tcctcgacgg tcagctcccc gggcgggcgg 12 00 
tcgtggggca gcgcgcccat cagccgggcc gtccgcagat gcagcgcgac cgcgtcgggg 12 60 
gcggccgcgc gcgccccggc ggaggtgtcg accagtgtga ccgggtgccc gtgtccgacg 132 0 
gcgagtgccg cgatggccgt gcccatgacg cccgcgccga gcacgacgag cggagaattt 13 80 
tccttggaat cgggcacgga tcctccagaa tcccgggggc ggcggctgtg cgaaatgctg 1440 
tcccgaatcg cttccgcgct ccatcacccg ggcgtgactt tgtcacctag caagcggtgg 1500 
gaggccgggc ggaggctatg tcatctcggc cttgtccgct tacgagttcc gtccttaaag 15 60 
tgcgcccggc gaacgcacgg cggaattgac tcgccgtccg tcaaggaccc gcggttcgaa 162 0 
ggacctcgac gcatgaaggg tttcacatgg ctcatatcgc attcttcatc cttccggttg 1680 
ccgggcatgt gaatccgacc ctgggagtcg ccgaggaact ggtcgcgcgc ggccaccggg 1740 
tgacgttcgc gctgtccgag gacctcgccg agcgggcccg gctgatcggc gccgaggtgg 1800 
tcacctatcc ggtggacagg caacggttcc tggaccagat ggtgccgcgg caggacgcgg 186 0 
acgagtacac ggacgaggac gagttcgtcc gggtcctgga gtggctgctg gacatgacgg 1920 
tgcagaccat ggaaccgctg gagaggcact tcgccgggga ccggcccgac gtcgtcgtca 19 80 
acgatccgtc gtcgctgtgg acgggacggc tgctggcgga ccggtggggc atcccggtca 2 040 
tccgcagcac tccgacctat gccgccaacg aacactggtc gctgcatccg ccggtcgact 2100 
cggccgagcc gccggacgac cccgagctgc acaagctgct cgcgcggatc gagcggctgc 2160 
tggaggagca gggcgtcgag cacgacctgg ccggcttcac cggggtcccg cacggcggtc 2220 
cggccctgct gtacatgccc cgctcgttcc agtacgcggg cgagaccttc gacgcacagc 2280 
accacttcgt cggcccctgc ccgccccgca ccgcgttcca cggcgagtgg aggccggggg 2340 
acgacgacgg ccggcccctg gtgctggtga gtctcggaac cctgtacaac gaccggccgg 2400 
acttcttccg cacctgcctg gaggcgttcg gcgacgagcc ctggaacgtg cttctggtgc 2460 
tgggcggcgg ggtgcccgcg gccgacctgg gcccgcttcc cggcaatgtc cgggtgaccg 2520 
acttcgtgtc gctgcgcgac gtcctgccgc acacggcggt ggtggtgaac cacggtggga 2580 
tgagcaccgc catggaggtg ttctcgcacg gtgtgccggt ggtggcgatc ccggtgatgc 2 640 
cggagccccg ggccaccgcg cggcggatcg tcgaactggg cctgggcgac cagctgctga 27 00 
actcggagct gacggccgag tccctgcgtg ccacggtacg gcgggtgctg gcggactccg 27 60 
cgatcccggg gaacatgcgc gggttccggg agcagatcag ggcggccggc ggggcgcccg 2 82 0 
cggcggccga cgcgatcgag ggactgctgc cccgggtggg ctgagacgtc cgcgcccgac 2 880 
acgcgttcac cttccgaacg gcgggatcgc cccatgctca tcaccgaaac agcagtgccc 2 940 
gacgtgttcc gcatcgatcc ggaaccgctg ccggaccacc ggggccggtt ctacgaagcg 3000 
gtgcgccgcg ggccgctgga ggccgccgtc gggcactcgg tcgaggtccg gcaggtccac 3 060 
tgcaccgtct ccgggcgcaa cgtactgcgc ggcctgcacg ccaccaccct gccgccgggc 3120 
caggccaaga tcctcacctg tgtgcggggt gcggcgctga ctatggtggt cgacatgagg 3180 
gtcgggtcac cgggcttcgg acggtacgag gcggtgcggc aggatgcccc gtcgggcacc 3240 
gcgctctacc tgccggacgg catcggcctg ggctacgtgg ccctcgcgga cgacacatgc 3300 
atgaactacc tgtgcaccga ggagtacgtc ccgggcatgg tcatcgacgt ggacgccctg 3360 
gaccccgaac tcggcctgcc gtggggactg accggggatc ccgtccgctc cgcccgggac 3420 
gcggcggcgc cgtccctgcg ggcggccgcg gcggcgggaa ttctgcccac gtacgaggac 3480 
tgcttacggg tgcgcacgtc cgtgcccgcc cctcccgacc ggactcggct ctgacgcgac 3 540 
ggacacgacc gccgcgcatc cgacgcgaat ccgacgcgaa tccgaactcg atttcccgaa 3600 
ccgtggacgg agcgcgtccn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3 660 
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3 72 0 
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3780 
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn. nnnnnnnnnn nnnnnnnnnn 3 840 
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3900 
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3960 
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tmrmrmrmnn nnnnnnnrmn nnrmnnnnnn rmnnnnnnnn nimiinnrinnn nnnxinnnimn 402 0 
nniinnnrinnn rmnnnnnnnn rmnnnnnnnn nnnnnnnnnn nnnnnnnnnc cgccacaccc 4080 
cccagcagcg tcagcgtccg cctcgggacc acacccggca ggacgacggg gtgcggggcg 414 0 
acgaggctga gggagccccg caactccacg gggcggctca accgcttgag ctgctccatc 42 0 0 
aactgctggg ccgaggtggt ccccgtgtgg tggtccaccg ggccgcggcc gctcgccgag 4260 
gccagccgga ggttcccgcc cacccgcacc atgaagggca ggcccgcgag accgagccct 432 0 
cgcaccagtc gtggcagcac ggccgcgcgt gcgtccatca ccacggggcg ggccaaggag 43 80 
cggttggcct gagcggcttc ggccaccagg cggacgatgt tctcctcctc accgggtgcg 4440 
ccggggtgcc ggggtgtgcc ctccccgctc cggccgccgc ccagcgtcag gcgccagctg 4500 
accggggcgg ccgtcgtgcc cgaggccagc cacagcccgt gactctgctg gcagctcacc 4 5 60 
acccggccca ggtcggagac gaagcgccgg ctcaccccga cggagcgcac ccccgccttg 4 62 0 
gagaccacca tcggccagat cacccaggcg tcgggggtca gcctgtcgtc cacgtagcgg 4 6 80 
gccagcgcgg cccgcacctc gccccagtcc caggtcgacc cggcgacgaa gtggtgcagg 4740 
ctctgttccg ccgcgccctc tccgacgaag gcggcgaggt tccgggcggt cttgcgtccc 4800 
tgtgccgtga gcagcccgcg tatgtactgc tcacctcttc tgcgctggtc cgcccggcgg 4860 
agcgaaccga gtaactccgc acatgcgtcg gagacgagcg agtcgaagtc gtgccgcgcg 4920 
gcgggaccca cggggggcgc cgcgccggcg ggtcgaagcg tgcgtaaggt cataggagtc 49 80 
ctcgtggggg cctcgtcatc actgcgagtg gactgcgacc agcatcgcca attcacccgt 5040 
tgctccccag gtacaccggg cacactcgtt ccgcttcgct cccccggcgg cacggcccgc 5100 
gtgtggagca ctccccgctc tccggacggt gggggggaag cccaccgcac gcgcgccggt 5160 
agcggtgccg gggccccaca acccctcacc gacggggtcc gttcgaccac atgccgtgat 5220 
gatgccttcg ccgcacggcc tccttgaatg acggaccgtc agaaagacgt cactccgcgc 52 80 
gcgcccgctc ccgccccgac cccgcccggc cgccgtcccg cccccgcgac cctgtgggcc 5340 
gacgccctct tgacggaccc ggaatcccgg gccgcgggac gggacggcga ggaactcgat 5400 
gccgcaaagg ttccgcgtcc tcaccggcac ctccgagatc cagcgcaacg gcatcgccaa 5460 
gctcctggct ttccaccact gagccgcacc ccctggcgag cagatccggg acaagacgcc 5520 
accttcgcga cagtgtttag gaaaagttaa gtaaagaatt ccgcgagcgg attgccaggg 5 5 80 
agaacaaccc attgacgcgc accggtgcag cggccacatt gacggcacct gtcaagttca 5640 
cccccaggag cttggaatcc catgcaggca attcggcatc acgtcatgct cgtcatggcc 57 00 
ttcgtgaccg tcgccacgac tttccttctc tggccgtcga cgcaatccgc gcaagcgttt 57 60 
cccccgaccc cgaagcagac ggtactgaac cacctccgcg ccatttccgg gaatcacatc 5820 
gtctccggac agcacaacaa ggagcccgcc tccgccccgg gccagtacac ccagcaggtc 5880 
aaggacgtca ccgggcagta ccccggcctg tggggcggtg acctgatgtt cgccgcggcg 5940 
gacgtggccg gccgccagcg cgtcgtcgac caggccagga ccgagtgggc gaacggatcg 6000 
ctggtctcgc tcacctggca cgtctgcccg ccgaccggcg gcagcacctg tgcgttcgag 6060 
ggcggcgtca agtccacgct gacgaacgcg cagttctcgc aggtcctcac ggagggcagt 612 0 
gccctgaaca gcgcatggaa gcggcgcctg gacgaggtcg tcccgtacct gcagcagctg 6180 
gagaacgcgg gcgtccccgt cctcttccgg ccgctgcacg agatgaacga atcctggaac 6240 
tggtggggaa accggcccgg agcgaacggc agcgcacgcc tctaccagat cacccgcgat 63 00 
cacctcgccg ggacgaaagg gctggacaat ctgatctggg tctggaacgt ccaggacaat 63 6 0 
ccggcgggaa actggaacag ctactatccg ggagatcagt acgtggacgt cgtttcgctg 642 0 
gacgtctggt acaagagcca cccgagttcc gccgactacc agcagatgcg gagcatcgcg 6480 
ggaacaaaac ccatggccct cgcggagctg ggcaaaatgc cgaccgccgc gctgctggac 6540 
agccagacgc ggtggacatg gttcatgatg tggtccgagc atctgcgcgg gaacaattcc 6600 
aacgccgaaa tacagacggc gtatttccac ccccgtgtac tgaaccaggg ggaggtcgca 6660 
ctgccctgac gctcggcgct gcccggctct ctcacgcgcg ttctgacagg acgtcgcgga 672 0 
gagtgcgggg caagcggccg gtgagctggg cgcagtcgtc gcggacccga tcccagcgct 6780 
gttcgcgtac cgaggcgaac agggaggaga aggcgtagag ccaccaggga tccaggccgg 6 840 
tcgccgctgt ttcggcagag tacgtgtcgg ccgggatgtc cacgtaggcg accggtgtcc 6900 
gccacacctc cgccgccgtg gaggcgatgc ctgccaggtc cgtcgactcg ggtcccgtga 6960 
tgtcgtggtg acggccggtc ggcccgccca ccgcgagggc ggcgagggcg cgggccacgt 7 02 0 
cgtcgcgcgc caccagggac acccggccat cggctgccgg cagcctcagc agcccggtcg 7 080 
agcgcgcctg ggtgagccag cctaggaaga actcgatgta cagcgaggcc ctggcgaacg 7140 
agcacggcac gccggaggcg agcagcagat cctcggtgag ccggttgacg acggcgtagc 7200 
agaacgggga ggccgagtcg gcgtcgacgc tgctcagtgc cgcgacatgg ccgacgcgct 72 60 
cggccaccac ggcggcgacg acgttgcggt ggtgcagcag cacccgtgcg tcgggcccgt 732 0 
cgctggagac gaggaccaga gtgtccacgc ccttcagcgc cgcacgcaga gcgggcgggt 7380 
cggcgtagtc ggcgacggcg cactccaccc ccggcggtag tgcctcggca ggcagcttcc 7440 
gcctggtcat cgccacgacg tccacgtcgg cccggtccgc gagcagctgc accacccgcc 7500 
tgcccagact gcccgccgcc cctgtcaccg cgatacgcat cgtcgccccc gtcgccttgt 7560 
cgtcggtcgt accaccgtag ggggccaacc gcgaccaggg cttggaacga gccggcccgc 7 62 0 
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cagggcacag acgcgcgatc ggtccggttt tcccgtgctc ttttggaccg ggacgccgga 7 6 80 
ccgcttcctt tctacggtgg agccgttccc gcccgagccc gcacgtcatc gacgtgcggg 7740 
gaagacagag gtgataccga tgctccgacg ccgtctcgga gggccgtcag gccccctcgt 7800 
cagtgccctg tgcctgggcg cgatgccctt cggcaccacc gtcgacgaga agacgtcctt 7 860 
cgccatcctc gaccggttcg tcgaggccgg cggcagtctc gtcgacaccg ccgacaacta 792 0 
cgcgttctgg gctcccggcg ggaccgggga cgagagcgag aacaccgtcg ggcgctggct 7980 
ggcgagccgc cgccgccgcg acgaggtggt gatctccacc aaggtgggtg cccgccccac 804 0 
cgtccccggc agcggcctgg agaccgccga agggctgtcg gctcccgtca tacggaaggc 810 0 
cgcggaggac agcet-gegac gcctgggcac cgatcgcatc - gatctgtact ggacccacat 8160 
cgaggaccgg accgtccctc tggaggagac gctcggagct ctcgacgagc tggtcggcgg 822 0 
cggcaaggtg gcggtgctgg g'ctgctccaa ccacgcgggc tggcgcatcg aacgggcccg 82 80 
cgcgctcgcc cggaccaacg gctggacggc gtacacctgc gtccagcagc gctactccta 8340 
ccttcagccg cgcttcgacg tcggactgcc ggagagcgga cacgtccacg cgacctccga 84O0 
actcctcgac cacgtacgca gcgagcccga cctgacgctg ctggcctact cgtccctgct 8460 
ctcgggcgcg tacacccggc cggacaagac cctgtccgcc gcctacgacc acccgggcac 852 0 
cgggcagcgg ctgaccgtgc tgcgggaggt ggccgccgag ctcggtgcca ccgccaacca 8580 
ggtggtgctg tcctggttgc tcggaggtga tccgccggtg atcccgatcg tgggggtgag 8640 
ttccgtcgag cagctggacg aggtgctggc cgccgtcgag ctggagctgc cccgggagac 87 00 
gagggcacgg ctggacctcg ccgggcgggg ctgacgggcc acacaccgcc cctcgcccgg 87 60 
gacgggctga ccggccgcac accgtccctc agccgggacg ggctgacggc cacacacccg 882 0 
cccctcagcc cggctgggct gggctgacgg ccacacaccc gctcctcagc ccggctgggc 8880 
tgggctgacg gccacacacc cgcccctcag cccggctggg ctgggctgac ggccacacgc 8940 
cgtccctcgc ccgggtcggg ctgaccagcc acacgccgtc cctcagtcgg cccgctcccc 900 0 
ggcccgcccg gcgtcgacgt gccgccggtc gtggcgccgg gccgcgtcga tggcctgtgc 9 060 
caggcgccgc acggctccgg gcacggcgtg gtccgccaga ttgccgtagc cgaggaccag 912 0 
cgcggggccg gcggcggcca cggcccgcgc cccgccggag tcgccggccc gggccgtcgg 9180 
gtggtgctcg gcccgcgcca tccggtaggc gtcgagatcc gccagcctca cgtcacgccg 92 4 0 
cgccgcctcc ctgacgacgg tgggcgccga gcagtccgtc agggacagca gcaggtggaa 93 00 
gccggccgcc gcaccggaca cctggaaccc cggcagcgac gccgcgagtt ctcccatgag 93 6 0 
gtgatcgcgg cgccgtttgt agcgcagccg tgccgcccgc aggtaccggt cgtaggaccc 9 42 0 
gcgggccagg aaccgggcga acgcctcctg gtcgatgacg ggcggtggta cgcccccgac 9480 
gtgctccgcg cccagggcct cggtccagcg cggcggggtc accgcccagc cgatccgcag 9540 
ggccggcgag agcgtcttgc tgaccgaccc cagcagcgcg acgtgctccg gtgccatgcc 9 6 00 
ctgcagggcg cccacggggt ggcggtcgta tcggaactcg gcgtcgtagt cgtcctccag 9660 
caccaggccg tcgacctcgc gggcccaggc gaccagctcg ccgcgacggg ccggggcgag 972 0 
gaccacaccg gtcgggaact ggtgggcggg agcgacgatc accgaccgga cctgaggcgc 97 80 
gcgccgcagc aggtcgaccc gcaggccgtc gccgtccacg ggaaccggga cgggcaccag 984 0 
cccctccgcc ccgaccgtgg cgctcagccg cgaccagcca gggtcctcca gggccatgtg 9900 
ggtgtggccc tcggtccgca ggacccggca cagcctgcgc accgcgtcca gcgtgcccgc 9960 
gcagacgacg agctgccggg cttccagcga cgcgccgcgt ccccgcacga ggtaggccgc 10020 
gagccgctgc cggagccggg cgagaccggc cggatcgggg tagccgagct cgccccaggt 10080 
cagtgcgccg gtggcctccc gcaccgcgtc cgcccaccgt ccgcggggaa aggcccgcag 10140 
gtcgggtatg ccgggcagca tgtcgaactc cggctcccac cgcgtaccga cgtccgcctc 102 00 
gggcgtcacc ggagcgggga cggcctgcgc cctgacccgg gtggccgagc cgctgcgcgc 10260 
ctccaggtac ccctccgcga cgagctgcgc gtagggggga tcctctagag tcgacctgca 10320 
ggcct 10325 

<210> 107 

<211> 1218 

<212> ADN 

<213> Streptomyces ambof aciens 

<220> 

<221> CDS 

<222> (1) . . (1218) 

<400> 107 

atg get cat ate gca ttc ttc ate ctt ccg gtt gec ggg cat gtg aat 48 

Met Ala His lie Ala Phe Phe lie Leu Pro Val Ala Gly His Val Asn 
15 10 15 
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ccg acc ctg gga 
Pro Thr Leu Gly 
20 

acg ttc gcg ctg 
Thr Phe Ala Leu 
35 

gcc gag gtg gtc 
Ala Glu Vai Val 
50 

atg gtg ccg egg 
Met Val Pro Arg 
65 

gtc egg gtc ctg 
Val Arg Val Leu 



ccg ctg gag agg 
Pro Leu Glu Arg 
100 

gat ccg teg teg 
Asp Pro Ser Ser 
115 

ate ccg gtc ate 
lie Pro Val lie 
130 

teg ctg cat ccg 
Ser Leu His Pro 
145 

ctg cac aag ctg 
Leu His Lys Leu 



gtc gag cac gac 
Val Glu His Asp 
180 

gcc ctg ctg tac 
Ala Leu Leu Tyr 
195 

gac gca cag cac 
Asp Ala Gin His 
210 

cac ggc gag tgg 
His Gly Glu Trp 
225 

gtg agt etc gga 
Val Ser Leu Gly 



gtc gcc gag 
Val Ala Glu 



tec gag gac 
Ser Glu Asp 



acc tat ccg 
Thr Tyr Pro 
55 

cag gac gcg 
Gin Asp Ala 
70 

gag tgg ctg 
Glu Trp Leu 
85 

cac ttc gcc 
His Phe Ala 



ctg tgg acg 
Leu Trp Thr 



cgc age act 
Arg Ser Thr 
135 

ccg gtc gac 
Pro Val Asp 
150 

etc gcg egg 
Leu Ala Arg 
165 

ctg gcc ggc 
Leu Ala Gly 



atg ccc cgc 
Met Pro Arg 



cac ttc gtc 
His Phe Val 
215 

agg ccg ggg 
Arg Pro Gly 
230 

acc ctg tac 
Thr Leu Tyr 
245 



gaa ctg gtc 
Glu Leu Val 
25 

etc gcc gag 
Leu Ala Glu 
40 

gtg gac agg 
Val Asp Arg 



gac gag tac 
Asp Glu Tyr 



ctg gac atg 
Leu Asp Met 
90 

ggg gac egg 
Gly Asp Arg 
105 

gga egg ctg 
Gly Arg Leu 
120" 

ccg acc tat 
Pro Thr Tyr 



teg gcc gag 
Ser Ala Glu 



ate gag egg 
lie Glu Arg 
170 

ttc acc ggg 
Phe Thr Gly 
185 

teg ttc cag 
Ser Phe Gin 
200 

ggc ccc tgc 
Gly Pro Cys 



gac gac gac 
Asp Asp Asp 



aac gac egg 
Asn Asp Arg 
250 



gcg cgc ggc cac 
Ala Arg Gly His 
30 

egg gcc egg ctg 
Arg Ala Arg Leu 
45 

caa egg ttc ctg 
Gin Arg Phe Leu 
60 

acg gac gag gac 
Thr Asp Glu Asp 
75 

acg gtg cag acc 
Thr Val Gin Thr 



ccc gac gtc gtc 
Pro Asp Val Val 
110 

ctg gcg gac egg 
Leu Ala Asp Arg 
125 

gcc gcc aac gaa 
Ala Ala Asn Glu 
140 

ccg ccg gac gac 
Pro Pro Asp Asp 
155 

ctg ctg gag gag 
Leu Leu Glu Glu 



gtc ctg cac ggc 
Val Leu His Gly 
190 

tac gcg ggc gag 
Tyr Ala Gly Glu 
205 

ccg ccc cgc acc 
Pro Pro Arg Thr 
220 

ggc egg ccc ctg 
Gly Arg Pro Leu 
235 

ccg gac ttc ttc 
Pro Asp Phe Phe 



egg gtg 96 
Arg Val 



ate ggc 144 
He Gly 



gac cag 192 
Asp Gin 



gag ttc 240 
Glu Phe 
80 

atg gaa 2 88 
Met Glu 
95 

gtc aac 33 6 
Val Asn 



tgg ggc 3 84 
Trp Gly 



cac tgg 43 2 
His Trp 



ccc gag 480 
Pro Glu 
160 

cag ggc 52 8 

Gin Gly 

175 

ggt ccg 57 6 
Gly Pro 



acc ttc 624 
Thr Phe 



gcg ttc 672 
Ala Phe 



gtg ctg 720 
Val Leu 
240 

cgc acc 7 68 

Arg Thr 

255 
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tgc ctg gag gcg ttc ggc gac gag ccc tgg aac gtg ctt ctg gtg ctg 816 
Cys Leu Glu Ala Phe Gly Asp Glu Pro Trp Asn Val Leu Leu Val Leu 
260 265 270 

9QC ggc ggg gtg ccc gcg gcc gac ctg ggc ccg ctt ccc ggc aat gtc 864 
Gly Gly Gly Val Pro Ala Ala Asp Leu Gly Pro Leu Pro Gly Asn Val 
275 280 285 

.egg . gtg .ace gac -ttc- gtg teg ctg- cgc gac gtc - ctg- ccg- -cac acg gcg 912 - 

Arg Val Thr Asp Phe Val Ser Leu Arg Asp Val Leu Pro His Thr Ala 
290 ... 295 . • 300 

gtg gtg gtg aac cac ggt ggg atg age acc gcc atg gag gtg ttc teg 9 60 
Val Val Val Asn His Gly Gly Met Ser Thr Ala Met Glu Val Phe Ser 
305 310 315 320 

cac ggt gtg ccg gtg gtg gcg ate ccg gtg atg ccg gag ccc egg gcc 1008 
His Gly Val Pro Val Val Ala lie Pro Val Met Pro Glu Pro Arg Ala 
325 330 335 

acc gcg egg egg ate gtc gaa ctg ggc ctg ggc gac cag ctg ctg aac 1056 
Thr Ala Arg Arg lie Val Glu Leu Gly Leu Gly Asp Gin Leu Leu Asn 
340 345 350 

teg gag ctg acg gcc gag tec ctg cgt gcc acg gta egg egg gtg ctg 1104 
Ser Glu Leu Thr Ala Glu Ser Leu Arg Ala Thr Val Arg Arg Val Leu 
355 360 365 

gcg gac tec gcg ate ccg ggg aac atg cgc ggg ttc egg gag cag ate 1152 
Ala Asp Ser Ala lie Pro Gly Asn Met Arg Gly Phe Arg Glu Gin He 
370 375 380 

^gg gcg gcc ggc ggg gcg ccc gcg gcg gcc gac gcg ate gag gga ctg 1200 
Arg Ala Ala Gly Gly Ala Pro Ala Ala Ala Asp Ala He Glu Gly Leu 
385 390 395 400 

ctg ccc egg gtg ggc tga 1218 
Leu Pro Arg Val Gly 
405 



<210> 108 
<211> 405 
<212> PRT 

<213> Streptomyces ambofaciens 
<400> 108 

Met Ala His He Ala Phe Phe He Leu Pro Val Ala Gly His Val Asn 
15 10 15 

Pro Thr Leu Gly Val Ala Glu Glu Leu Val Ala Arg Gly His Arg Val 
20 25 30 

Thr Phe Ala Leu Ser Glu Asp Leu Ala Glu Arg Ala Arg Leu lie Gly 
35 40 45 

Ala Glu Val Val Thr Tyr Pro Val Asp Arg Gin Arg Phe Leu Asp Gin 
50 55 60 



Met Val Pro Arg Gin Asp Ala Asp Glu Tyr Thr Asp 
65 70 75 



Glu Asp Glu Phe 
80 
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Val Arg Val Leu Glu Trp Leu Leu Asp Met Thr Val Gin Thr Met Glu 
85 90 95 

Pro Leu Glu Arg His Phe Ala Gly Asp Arg Pro Asp Val Val Val Asn 
100 105 110 

Asp Pro Ser Ser Leu Trp Thr Gly Arg Leu Leu Ala Asp Arg Trp Gly 
115 120 125 

lie Pro Val lie Arg Ser Thr Pro Thr Tyr Ala Ala Asn Glu His Trp 
130 135 140 

Ser Leu His Pro Pro Val Asp Ser Ala Glu Pro Pro Asp Asp Pro Glu 
145 150 155 160 

Leu His Lys Leu Leu Ala Arg lie Glu Arg Leu Leu Glu Glu Gin Gly 
165 170 175 

Val Glu His Asp Leu Ala Gly Phe Thr Gly Val Leu His Gly Gly Pro 
180 185 190 

Ala Leu Leu Tyr Met Pro Arg Ser Phe Gin Tyr Ala Gly Glu Thr Phe 
195 200 • 205 

Asp Ala Gin His His Phe Val Gly Pro Cys Pro Pro Arg Thr Ala Phe 
210 215 220 

His Gly Glu Trp Arg Pro Gly Asp Asp Asp Gly Arg Pro Leu Val Leu 
225 - 230 235 240 

Val Ser Leu Gly Thr Leu Tyr Asn Asp Arg Pro Asp Phe Phe Arg Thr 
245 " 250 255 

Cys Leu Glu Ala Phe Gly Asp Glu Pro Trp Asn Val Leu Leu Val Leu 
260 265 270 

Gly Gly Gly Val Pro Ala Ala Asp Leu Gly Pro Leu Pro Gly Asn Val 
275 280 285 

Arg Val Thr Asp Phe Val Ser Leu Arg Asp Val Leu Pro His Thr Ala 
290 295 300 

Val Val Val Asn His Gly Gly Met Ser Thr Ala Met Glu Val Phe Ser 
305 310 315 320 

His Gly Val Pro Val Val Ala lie Pro Val Met Pro Glu Pro Arg Ala 
325 330 335 



Thr Ala Arg Arg He Val Glu Leu 
340 

Ser Glu Leu Thr Ala Glu Ser Leu 
355 360 

Ala Asp Ser Ala He Pro Gly Asn 
370 375 

Arg Ala Ala Gly Gly Ala Pro Ala 
385 390 



Gly Leu Gly Asp Gin Leu Leu Asn 
345 350 

Arg Ala Thr Val Arg Arg Val Leu 
365 

Met Arg Gly Phe Arg Glu Gin He 
380 

Ala Ala Asp Ala He Glu Gly Leu 
395 400 



1er depot 
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Leu Pro Arg Val Gly 
405 



_LL/-- _L \J Z> 

<211> 621 
<212> ADN 

- <213> Streptomyces -ambof aciens- - - ...... ... 

<22 0> 

<221> CDS 

<222> (1) . . (621) 

<400> 109 

atg etc ate acc gaa aca gca gtg ccc gac gtg ttc cgc ate gat ccg 48 

Met Leu lie Thr Glu Thr Ala Val Pro Asp Val Phe Arg lie Asp Pro 
15 10 15 

gaa ccg ctg ccg gac cac egg ggc egg ttc tac gaa gcg gtg cgc cgc 96 
Glu Pro Leu Pro Asp His Arg Gly Arg Phe Tyr Glu Ala Val Arg Arg 
20 25 30 

ggg ccg ctg gag gee gee gtc ggg eac teg gtc gag gtc egg cag gtc 144 
Gly Pro Leu Glu Ala Ala Val Gly His Ser Val Glu Val Arg Gin Val 
35 40 45 

cac tgc acc gtc tec ggg cgc aac gta ctg cgc ggc ctg cac gee acc 192 
His Cys Thr Val Ser Gly Arg Asn Val Leu Arg Gly Leu His Ala Thr 
50 55 60 

acc ctg ccg ccg ggc cag gee aag ate etc acc tgt gtg egg ggt gcg 240 
Thr Leu Pro Pro Gly Gin Ala Lys He Leu Thr Cys Val Arg Gly Ala 
65 70 75 80 

gcg ctg act atg gtg gtc gac atg agg gtc ggg tea ccg ggc ttc gga 288 
Ala Leu Thr Met Val Val Asp Met Arg Val Gly Ser Pro Gly Phe Gly 
85 90 95 

egg tac gag gcg gtg egg cag gat gee ccg teg ggc acc gcg etc tac 336 
Arg Tyr Glu Ala Val Arg Gin Asp Ala Pro Ser Gly Thr Ala Leu Tyr 
100 105 110 

ctg ccg gac ggc ate ggc ctg ggc tac gtg gee etc gcg gac gac aca 3 84 
Leu Pro Asp Gly He Gly Leu Gly Tyr Val Ala Leu Ala Asp Asp Thr 
115 120 125 

tgc atg aac tac ctg tgc acc gag gag tac gtc ccg ggc atg gtc ate 432 
Cys Met Asn Tyr Leu Cys Thr Glu Glu Tyr Val Pro Gly Met Val He 
130 135 140 

gac gtg gac gee ctg gac ccc gaa etc ggc ctg ccg tgg gga ctg acc 480 
Asp Val Asp Ala Leu Asp Pro Glu Leu Gly Leu Pro Trp Gly Leu Thr 
145 150 155 160 

9Q9 g^t ccc gtc cgc tec gee egg gac gcg gcg gcg ccg tec ctg egg 528 
Gly Asp Pro Val Arg Ser Ala Arg Asp Ala Ala Ala Pro Ser Leu Arg 
165 170 175 

gcg gee gcg gcg gcg gga att ctg ccc acg tac gag gac tgc tta egg 57 6 
Ala Ala Ala Ala Ala Gly He Leu Pro Thr Tyr Glu Asp Cys Leu Arg 



1er depot 
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180 185 190 

gtg cgc acg tec gtg ccc gec cct ccc gac egg act egg etc tga 621 

Val Arg Thr Ser Val Pro Ala Pro Pro Asp Arg Thr Arg Leu 

195 200 205 



<210> 110 
<211> 206 
<212> PRT 

<213> Streptomyces ambofaciens 
<400> 110 

Met Leu lie Thr Glu Thr Ala Val Pro Asp Val Phe Arg lie Asp Pro 
15 10 15 

Glu Pro Leu Pro Asp His Arg Gly Arg Phe Tyr Glu Ala Val Arg Arg 
20 25 . 30 

Gly Pro Leu Glu Ala Ala Val Gly His Ser Val Glu Val Arg Gin Val 
35 40 45 

His Cys Thr Val Ser Gly Arg Asn Val Leu Arg Gly Leu His Ala Thr 
50 * 55 60 

Thr Leu Pro Pro Gly Gin Ala Lys lie Leu Thr Cys Val Arg Gly Ala 
65 70 75 80 

Ala Leu Thr Met Val- Val Asp Met Arg Val Gly Ser Pro Gly Phe Gly 
85 90 95 

Arg Tyr Glu Ala Val Arg Gin Asp Ala Pro Ser Gly Thr Ala Leu Tyr 
100 . 105 110 

Leu Pro Asp Gly lie Gly Leu Gly Tyr Val Ala Leu Ala Asp Asp Thr 
115 120 125 

Cys Met Asn Tyr Leu Cys Thr Glu Glu Tyr Val Pro Gly Met Val lie 
130 135 140 

Asp Val Asp Ala Leu Asp Pro Glu Leu Gly Leu Pro Trp Gly Leu Thr 
145 150 155 160 

Gly Asp Pro Val Arg Ser Ala Arg Asp Ala Ala Ala Pro Ser Leu Arg 
165 170 175 

Ala Ala Ala Ala Ala Gly lie Leu Pro Thr Tyr Glu Asp Cys Leu Arg 
180 185 190 

Val Arg Thr Ser Val Pro Ala Pro Pro Asp Arg Thr Arg Leu 
195 200 205 



<210> 111 
<211> 960 
<212> ADN 

<213> Streptomyces ambofaciens 



<220> 
<221> CDS 



1er depot 



149 



<222> (1) . . (903) 
<400> 111 

atg acc tta cgc acg ctt cga ccc gcc ggc gcg gcg ccc ccc gtg ggt 48 
Met Thr Leu Arg Thr Leu Arg Pro Ala Gly Ala Ala Pro Pro Val Gly 

i c in 1 c; 

U- —> J.W •* ' 

ccc gcc gcg egg cac gac ttc gac teg etc gtc tec gac gca tgt gcg 96 

Pro Ala Ala Arg His Asp Phe Asp.- Ser Leu Val. Ser Asp Ala Cys Ala 

20 25 30 

gag tta etc ggt teg etc cgc egg gcg gac cag cgc aga aga ggt gag 144 
Glu Leu Leu Gly Ser Leu Arg Arg Ala Asp Gin Arg Arg Arg Gly Glu 
35 40 45 

cag tac ata cgc ggg ctg etc acg gca cag gga cgc aag acc gcc egg 192 
Gin Tyr lie Arg Gly Leu Leu Thr Ala Gin Gly Arg Lys Thr Ala Arg 
50 55 60 

aac etc gcc gcc ttc gtc gga gag ggc gcg gcg gaa cag age ctg cac 240 
Asn Leu Ala Ala Phe Val Gly Glu Gly Ala Ala Glu Gin Ser Leu His 
65 70 75 80 

cac ttc gtc gcc ggg teg acc tgg gac tgg ggc gag gtg egg gcc gcg 2 88 
His Phe Val Ala Gly Ser Thr Trp Asp Trp Gly Glu Val Arg Ala Ala 
85 90 95 

ctg gcc cgc tac gtg gac gac agg ctg acc ccc gac gcc tgg gtg ate 336 
Leu Ala Arg Tyr Val Asp Asp Arg Leu Thr Pro Asp Ala Trp Val lie 
100 105 110 

tgg ccg atg gtg gtc tec aag gcg ggg gtg cgc tec gtc ggg gtg age 3 84 
Trp Pro Met Val Val Ser Lys Ala Gly Val Arg Ser Val Gly Val Ser 
115 120 125 

egg cgc ttc gtc tec gac ctg ggc egg gtg gtg age tgc cag cag agt 432 
Arg Arg Phe Val Ser Asp Leu Gly Arg Val Val Ser Cys Gin Gin Ser 
130 135 140 

cac ggg ctg tgg ctg gcc teg ggc acg acg gcc gcc ccg gtc age tgg 480 
His Gly Leu Trp Leu Ala Ser Gly Thr Thr Ala Ala Pro Val Ser Trp 
145 150 155 160 

cgc ctg acg ctg ggc ggc ggc egg age ggg gag ggc aca ccc egg cac 52 8 
Arg Leu Thr Leu Gly Gly Gly Arg Ser Gly Glu Gly Thr Pro Arg His 
165 170 175 

ccc ggc gca ccc ggt gag gag gag aac ate gtc cgc ctg gtg gcc gaa 57 6 
Pro Gly Ala Pro Gly Glu Glu Glu Asn lie Val Arg Leu Val Ala Glu 
180 185 190 

gcc get cag gcc aac cgc tec ttg gcc cgc ccc gtg gtg atg gac gca 624 
Ala Ala Gin Ala Asn Arg Ser Leu Ala Arg Pro Val Val Met Asp Ala 
195 200 205 

cgc gcg gcc gtg ctg cca cga ctg gtg cga ggg etc ggt etc gcg ggc 672 
Arg Ala Ala Val Leu Pro Arg Leu Val Arg Gly Leu Gly Leu Ala Gly 
210 215 220 



ctg ccc ttc atg gtg egg gtg ggc ggg aac etc egg ctg gcc teg gcg 
Leu Pro Phe Met Val Arg Val Gly Gly Asn Leu Arg Leu Ala Ser Ala 



720 



1er depot 
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225 230 235 240 

age ggc cgc ggc ccg gtg gac cac cac acg ggg acc acc teg gec cag 768 
Ser Gly Arg Gly Pro Val Asp His His Thr Gly Thr Thr Ser Ala Gin 
245 250 255 

cag ttg atg gag cag etc aag egg ttg age cgc ccc gtg gag ttg egg 816 
Gin Leu Met Glu Gin Leu Lys Arg Leu Ser Arg Pro Val Glu Leu Arg 
260 265 270 



ggc tec etc age etc gtc gee ccg cac ccc gtc gtc ctg ccg ggt gtg 
Gly Ser Leu Ser Leu Val Ala Pro His Pro Val Val Leu Pro Gly Val 
275 280 285 



864 



gtc ccg agg egg acg ctg acg ctg ctg ggg ggt gtg gcg gnnnnnnnnn 913 
Val Pro Arg Arg Thr Leu Thr Leu Leu Gly Gly Val Ala 
290 295 300 

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnn 9 60 



<210> 112 
<211> 301 
<212> PRT 

<213> Streptomyces ambofaciens 
<400> 112 

Met Thr Leu Arg Thr Leu Arg Pro Ala Gly Ala Ala Pro Pro Val Gly 
15 10 15 

Pro Ala Ala Arg His Asp Phe Asp Ser Leu Val Ser Asp Ala Cys Ala 
20 25 30 

Glu Leu Leu Gly Ser Leu Arg Arg Ala Asp Gin Arg Arg Arg Gly Glu 
35 40 45 

Gin Tyr He Arg Gly Leu Leu Thr Ala Gin Gly Arg Lys Thr Ala Arg 
50 55 60 

Asn Leu Ala Ala Phe Val Gly Glu Gly Ala Ala Glu Gin Ser Leu His 
65 70 75 80 

His Phe Val Ala Gly Ser Thr Trp Asp Trp Gly Glu Val Arg Ala Ala 
85 90 95 

Leu Ala Arg Tyr Val Asp Asp Arg Leu Thr Pro Asp Ala Trp Val He 
100 105 110 

Trp Pro Met Val Val Ser Lys Ala Gly Val Arg Ser Val Gly Val Ser 
115 120 125 

Arg Arg Phe Val Ser Asp Leu Gly Arg Val Val Ser Cys Gin Gin Ser 
130 135 140 

His Gly Leu Trp Leu Ala Ser Gly Thr Thr Ala Ala Pro Val Ser Trp 
145 150 155 160 

Arg Leu Thr Leu Gly Gly Gly Arg Ser Gly Glu Gly Thr Pro Arg His 
165 170 175 



Pro Gly Ala Pro Gly Glu Glu Glu Asn He Val Arg Leu Val Ala Glu 



1er depot 
151 



180 185 190 

Ala Ala Gin Ala Asn Arg Ser Leu Ala Arg Pro Val Val Met Asp Ala 
195 200 205 

Arg Ala Ala Val Leu Pro Arg Leu Val Arg Gly Leu Gly Leu Ala Gly 
210 215 ~ 220 

-Leu -Pro Phe Met -Val- Arg Val -Gly Gly Asn Leu Arg- Leu Ala - Ser Ala 
225 230 235 240 

Ser Gly Arg Gly Pro Val Asp His His Thr Gly Thr Thr Ser Ala Gin 
245 250 255 

Gin Leu Met Glu Gin Leu Lys Arg Leu Ser Arg Pro Val Glu Leu Arg 
260 265 270 

Gly Ser Leu Ser Leu Val Ala Pro His Pro Val Val Leu Pro Gly Val 
275 280 285 

Val Pro Arg Arg Thr Leu Thr Leu Leu Gly Gly Val Ala 
290 295 300 



<210> 113 
<211> 1008 
<212> ADN 

<213> Streptomyces ambof aciens 

<220> 

<221> CDS 

<222> (1) . . (1008) 

<400> 113 

atg cag gca att egg cat cac gtc atg etc gtc atg gec ttc gtg acc 48 
Met Gin Ala lie Arg His His Val Met Leu Val Met Ala Phe Val Thr 
15 10 15 

gtc gec acg act ttc ctt etc tgg ccg teg acg caa tec gcg caa gcg 96 
Val Ala Thr Thr Phe Leu Leu Trp Pro Ser Thr Gin Ser Ala Gin Ala 
20 25 30 

ttt ccc ccg acc ccg aag cag acg gta ctg aac cac etc cgc gec att 144 
Phe Pro Pro Thr Pro Lys Gin Thr Val Leu Asn His Leu Arg Ala lie 
35 40 45 

tec ggg aat cac ate gtc tec gga cag cac aac aag gag ccc gee tec 192 
Ser Gly Asn His lie Val Ser Gly Gin His Asn Lys Glu Pro Ala Ser 
50 55 60 

gee ccg ggc cag tac acc cag cag gtc aag gac gtc acc ggg cag tac 240 
Ala Pro Gly Gin Tyr Thr Gin Gin Val Lys Asp Val Thr Gly Gin Tyr 
65 70 75 80 

ccc ggc ctg tgg ggc ggt gac ctg atg ttc gee gcg gcg gac gtg gec 288 
Pro Gly Leu Trp Gly Gly Asp Leu Met Phe Ala Ala Ala Asp Val Ala 
85 90 95 

ggc cgc cag cgc gtc gtc gac cag gee agg acc gag tgg gcg aac gga 336 
Gly Arg Gin Arg Val Val' Asp Gin Ala Arg Thr Glu Trp Ala Asn Gly 



1er depot 
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100 105 110 

teg ctg gtc teg etc ace tgg cac gtc tgc ccg ccg ace ggc ggc age 
Ser Leu Val Ser Leu Thr Trp His Val Cys Pro Pro Thr Gly Gly Ser 
115 120 125 

acc tgt gcg ttc gag ggc ggc gtc aag tec acg ctg acg aac gcg cag 
Thr Cys Ala Phe Glu Gly Gly Val Lys Ser Thr Leu Thr Asn Ala Gin 
130 135 140 



egg cgc ctg gac gag gtc gtc ccg tac ctg cag cag ctg gag aac gcg 
Arg Arg Leu Asp Glu Val Val Pro Tyr Leu Gin Gin Leu Glu Asn Ala 
165 170 175 



aac tgg tgg gga aac egg ccc gga gcg aac ggc age gca cgc etc tac 
Asn Trp Trp Gly Asn Arg Pro Gly Ala Asn Gly Ser Ala Arg Leu Tyr 
195 200 205 



384 



432 



ttc teg cag gtc etc acg gag ggc agt gee ctg aac age gca tgg aag 480 
Phe Ser Gin Val Leu Thr Glu Gly Ser Ala Leu Asn Ser Ala Trp Lys 
145 150 155 160 



528 



ggc gtc ccc gtc etc ttc egg ccg ctg cac gag atg aac gaa tec tgg 57 6 
Gly Val Pro Val Leu Phe Arg Pro Leu His Glu Met Asn Glu Ser Trp 
180 185 190 



624 



cag ate acc cgc gat cac etc gee ggg acg aaa ggg ctg gac aat ctg 672 
Gin lie Thr Arg Asp His Leu Ala Gly Thr Lys Gly Leu Asp Asn Leu 
210 215 220 

ate tgg gtc tgg aac gtc cag gac aat ccg gcg gga aac tgg aac age 72 0 
He Trp Val Trp Asn Val Gin Asp Asn Pro Ala Gly Asn Trp Asn Ser 
225 230 v 235 240 

tac tat ccg gga gat cag tac gtg gac gtc gtt teg ctg gac gtc tgg 768 
Tyr Tyr Pro Gly Asp Gin Tyr Val Asp Val Val Ser Leu Asp Val Trp 
245 250 255 

tac aag age cac ccg agt tec gee gac tac cag cag atg egg age ate 816 
Tyr Lys Ser His Pro Ser Ser Ala Asp Tyr Gin Gin Met Arg Ser He 
260 265 270 

gcg gga aca aaa ccc atg gee etc gcg gag ctg ggc aaa atg ccg acc 864 
Ala Gly Thr Lys Pro Met Ala Leu Ala Glu Leu Gly Lys Met Pro Thr 
275 280 285 

gee gcg ctg ctg gac age cag acg egg tgg aca tgg ttc atg atg tgg 912 
Ala Ala Leu Leu Asp Ser Gin Thr Arg Trp Thr Trp Phe Met Met Trp 
290 295 300 

tec gag cat ctg cgc ggg aac aat tec aac gee gaa ata cag acg gcg 960 
Ser Glu His Leu Arg Gly Asn Asn Ser Asn Ala Glu He Gin Thr Ala 
305 310 315 320 

tat ttc cac ccc cgt gta ctg aac cag ggg gag gtc gca ctg ccc tga 1008 
Tyr Phe His Pro Arg Val Leu Asn Gin Gly Glu Val Ala Leu Pro 
325 330 335 



<210> 114 
<211> 335 



1er depot 
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<212> PRT 

<213> Streptomyces ambofaciens 
<400> 114 

Met Gin Ala lie Arg His His Val Met Leu Val Met Ala Phe Val Thr 



Val Ala Thr Thr Phe Leu Leu Trp Pro Ser Thr Gin Ser Ala Gin Ala 

- - 20 _ . 25 •• •- 30 

Phe Pro Pro Thr Pro Lys Gin Thr Val Leu Asn His Leu Arg Ala He 
35 40 45 

Ser Gly Asn His lie Val Ser Gly Gin His Asn Lys Glu Pro Ala Ser 
50 55 60 

Ala Pro Gly Gin Tyr Thr Gin Gin Val Lys Asp Val Thr Gly Gin Tyr 
65 70 75 80 

Pro Gly Leu Trp Gly Gly Asp Leu Met Phe Ala Ala Ala Asp Val Ala 
85 90 95 

Gly Arg Gin Arg Val Val Asp Gin Ala Arg Thr Glu Trp Ala Asn Gly 
100 105 110 

Ser Leu Val Ser Leu Thr Trp His Val Cys Pro Pro Thr Gly Gly Ser 
115 120 125 

Thr Cys Ala Phe Glu Gly Gly Val Lys Ser Thr Leu Thr Asn Ala Gin 
130 135 140 

Phe Ser Gin Val Leu Thr Glu Gly Ser Ala Leu Asn Ser Ala Trp Lys 
"5 150 155 160 

Arg Arg Leu Asp Glu Val Val Pro Tyr Leu Gin Gin Leu Glu Asn Ala 
165 170 175 

Gly Val Pro Val Leu Phe Arg Pro Leu His Glu Met Asn Glu Ser Trp 
180 185 190 

Asn Trp Trp Gly Asn Arg Pro Gly Ala Asn Gly Ser Ala Arg Leu Tyr 
195 200 205 

Gin He Thr Arg Asp His Leu Ala Gly Thr Lys Gly Leu Asp Asn Leu 
210 215 220 

He Trp Val Trp Asn Val Gin Asp Asn Pro Ala Gly Asn Trp Asn Ser 
225 230 235 • 240 

Tyr Tyr Pro Gly Asp Gin Tyr Val Asp Val Val Ser Leu Asp Val Trp 
245 250 255 

Tyr Lys Ser His Pro Ser Ser Ala Asp Tyr Gin Gin Met Arg Ser He 
260 265 270 

Ala Gly Thr Lys Pro Met Ala Leu Ala Glu Leu Gly Lys Met Pro Thr 
275 280 285 

Ala Ala Leu Leu Asp Ser Gin Thr Arg Trp Thr Trp Phe Met Met Trp 
290 295 300 



1er depot 
154 



Ser Glu His Leu Arg Gly Asn Asn Ser Asn Ala Glu lie Gin Thr Ala 
305 310 315 320 

Tyr Phe His Pro Arg Val Leu Asn Gin Gly Glu Val Ala Leu Pro 
325 330 335 



<210> 115 
<211> 1038 
<212> ADN 

<213> Streptomyces ambofaciens 

<220> 

<221> CDS 

<222> {1) . . (1038) 

<220> 
<221> CDS 

<222> (190) . . (1038) 
<400> 115 

atg acg tgc ggg etc ggg egg gaa egg etc cac cgt aga aag gaa gcg 48 
Met Thr Cys Gly Leu Gly Arg Glu Arg Leu His Arg Arg Lys Glu Ala 
1 5 10 15 

gtc egg cgt ccc ggt cca aaa gag cac ggg aaa acc gga ccg ate gcg 96 
Val Arg Arg Pro Gly Pro Lys Glu His Gly Lys Thr Gly Pro lie Ala 
20 25 30 

cgt ctg tgc cct ggc ggg ccg get cgt tec aag ccc tgg teg egg ttg 144 
Arg Leu Cys Pro Gly Gly Pro Ala Arg Ser Lys Pro Trp Ser Arg Leu 
35 . 40 45 

gee ccc tac ggt ggt acg acc gac gac aag gcg acg ggg gcg acg atg 192 
Ala Pro Tyr Gly Gly Thr Thr Asp Asp Lys Ala Thr Gly Ala Thr Met 
50 55 60 

cgt ate gcg gtg aca ggg gcg gcg ggc agt ctg .ggc agg egg gtg gtg 240 
Arg He Ala Val Thr Gly Ala Ala Gly Ser Leu Gly Arg Arg Val Val 
65 70 75 80 

cag ctg etc gcg gac egg gee gac gtg gac gtc gtg gcg atg acc agg 2 88 
Gin Leu Leu Ala Asp Arg Ala Asp Val Asp Val Val Ala Met Thr Arg 
85 90 95 

egg aag ctg cct gee gag gca eta ccg ccg ggg gtg gag tgc gee gtc 33 6 
Arg Lys Leu Pro Ala Glu Ala Leu Pro Pro Gly Val Glu Cys Ala Val 
100 105 110 

gec gac tac gee gac ccg ccc get ctg cgt gcg gcg ctg aag ggc gtg 3 84 
Ala Asp Tyr Ala Asp Pro Pro Ala Leu Arg Ala Ala Leu Lys Gly Val 
115 120 125 

gac act ctg gtc etc gtc tec age gac ggg ccc gac gca egg gtg ctg 432 
Asp Thr Leu Val Leu Val Ser Ser Asp Gly Pro Asp Ala Arg Val Leu 
130 135 140 



ctg cac cac cgc aac gtc gtc gec gee gtg gtg gee gag cgc gtc ggc 
Leu His His Arg Asn Val Val Ala Ala Val Val Ala Glu Arg Val Gly. 
145 150 155 160 



480 
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cat gtc gcg gca ctg age age gtc gac gec gac teg gee tec ccg ttc 52 8 
His Val Ala Ala Leu Ser Ser Val Asp Ala Asp Ser Ala Ser Pro Phe 
165 170 175 

f-r*r< far rr/^r-* /-rf- rrfn => m ^ -> y.*- ~ ^ *~ ^ ^ C n C 

wv^.v^ ^^v^ yv-v wu.'w ^v-v_- dv-.v- yay yau i_y v_ v_ i_ v_ Cjwv^ ^/u 

Cys Tyr Ala Val Val Asn Arg Leu Thr Glu Asp Leu Leu Leu Ala Ser 
180 185 190 

ggc gtg ccg tgc teg ttc gee agg gee teg ctg tac ate gag ttc ttc 624 
Gly Val Pro Cys Ser Phe Ala Arg Ala Ser Leu Tyr He Glu Phe Phe ■ 
195 200 205 

eta ggc tgg etc acc cag gcg cgc teg ace ggg ctg ctg agg ctg ccg 672 
Leu Gly Trp Leu Thr Gin Ala Arg Ser Thr Gly Leu Leu Arg Leu Pro 
210 215 220 

gca gee gat ggc egg gtg tec ctg gtg gcg cgc gac gac gtg gee cgc 720 
Ala Ala Asp Gly Arg Val Ser Leu Val Ala Arg Asp Asp Val Ala Arg 
225 230 235 240 

gee etc gee gee etc gcg gtg ggc ggg ccg acc ggc cgt cac cac gac 768 
Ala Leu Ala Ala Leu Ala Val Gly Gly Pro Thr Gly Arg His His Asp 
245 250 255 

ate acg gga ccc gag teg acg gac ctg gca ggc ate gee tec acg gcg 816 
He Thr Gly Pro Glu Ser Thr Asp Leu Ala Gly He Ala Ser Thr Ala 
260 265 270 

gcg gag gtg tgg egg aca ccg gte gec tac gtg gac ate ccg gee gac 864 
Ala Glu Val Trp Arg Thr Pro Val Ala Tyr Val Asp He Pro Ala Asp 
275 280 285 

acg tac tct gec gaa aca gcg gcg acc ggc ctg gat ccc tgg tgg etc 912 
Thr Tyr Ser Ala Glu Thr Ala Ala Thr Gly Leu Asp Pro Trp Trp Leu 
290 295 300 

tac gee ttc tec tec ctg ttc gee teg gta cgc gaa cag cgc tgg gat 960 
Tyr Ala Phe Ser Ser Leu Phe Ala Ser Val Arg Glu Gin Arg Trp Asp 
305 310 315 320 

egg gtc cgc gac gac tgc gec cag etc acc ggc cgc ttg ccc cgc act 1008 
Arg Val Arg Asp Asp Cys Ala Gin Leu Thr Gly Arg Leu Pro Arg Thr 
325 330 335 

etc cgc gac gtc ctg tea gaa cgc gcg tga 1038 
Leu Arg Asp Val Leu Ser Glu Arg Ala 
340 345 



<210> 116 
<211> 345 
<212> PRT 

<213> Streptomyces ambof aciens 



<400> 116 

Met Thr Cys Gly Leu Gly Arg Glu Arg Leu His Arg Arg Lys Glu Ala 
15 10 15 

Val Arg Arg Pro Gly Pro Lys Glu His Gly Lys Thr Gly Pro He Ala 
20 25 30 
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Arg Leu Cys Pro Gly Gly Pro Ala Arg Ser Lys Pro Trp Ser Arg Leu 
35 40 45 

Ala Pro Tyr Gly Gly Thr Thr Asp Asp Lys Ala Thr Gly Ala Thr Met 
50 55 60 

Arg lie Ala Val Thr Gly Ala Ala Gly Ser Leu Gly Arg Arg Val Val 
65 70 75 80 

Gin Leu Leu Ala Asp Arg Ala Asp Val Asp Val Val Ala Met Thr Arg 
85 90 95 

Arg Lys Leu Pro Ala Glu Ala Leu Pro Pro Gly Val Glu Cys Ala Val 
100 105 110 

Ala Asp Tyr Ala Asp Pro Pro Ala Leu Arg Ala Ala Leu Lys Gly Val 
115 120 • 125 

Asp Thr Leu Val Leu Val Ser Ser Asp Gly Pro Asp Ala Arg Val Leu 
130 135 140 

Leu His His Arg Asn Val Val Ala Ala Val Val Ala Glu Arg Val Gly 
145 150 155 160 

His Val Ala Ala Leu Ser Ser Val Asp Ala Asp Ser Ala Ser Pro Phe 
165 170 175 

Cys Tyr Ala Val Val Asn Arg Leu Thr Glu Asp Leu Leu Leu Ala Ser 
180 185 190 

Gly Val Pro Cys Ser Phe Ala Arg Ala Ser Leu Tyr lie Glu Phe Phe 
195 200 205 

Leu Gly Trp Leu Thr Gin Ala Arg Ser Thr Gly Leu Leu Arg Leu Pro 
210 215 220 

Ala Ala Asp Gly Arg Val Ser Leu Val Ala Arg Asp Asp Val Ala Arg 
225 230 235 240 

Ala Leu Ala Ala Leu Ala Val Gly Gly Pro Thr Gly Arg His His Asp 
245 250 255 

lie Thr Gly Pro Glu Ser Thr Asp Leu Ala Gly lie Ala Ser Thr Ala 
260 265 270 

Ala Glu Val Trp Arg Thr Pro Val Ala Tyr Val Asp lie Pro Ala Asp 
275 280 285 

Thr Tyr Ser Ala Glu Thr Ala Ala Thr Gly Leu Asp Pro Trp Trp Leu 
290 295 300 

Tyr Ala Phe Ser Ser Leu Phe Ala Ser Val Arg Glu Gin Arg Trp Asp 
305 310 315 320 

Arg Val Arg Asp Asp Cys Ala Gin Leu Thr Gly Arg Leu Pro Arg Thr 
325 330 335 

Leu Arg Asp Val Leu Ser Glu Arg Ala 
340 345 
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<210> 117 
<211> 282 
<212> PRT 

<213> Streptomyces ambofaciens 
<400> 117 

Met Axg lie Ala Val Thr Gly Ala Ala Gly Ser Leu Gly Arg Arg Val 

1 - -- 5 ~ - 10 - - - - 15 



Val Gin Leu Leu Ala Asp Arg Ala Asp Val Asp Val Val Ala Met Thr 
20 25 30 

Arg Arg Lys Leu Pro Ala Glu Ala Leu Pro Pro Gly Val Glu Cys Ala 
35 40 45 

Val Ala Asp Tyr Ala Asp Pro Pro Ala Leu Arg Ala Ala Leu Lys Gly 
50 55 60 

Val Asp Thr Leu Val Leu Val Ser Ser Asp Gly Pro Asp Ala Arg Val 
65 70 75 80 

Leu Leu His His Arg Asn Val Val Ala Ala Val Val Ala Glu Arg Val 
85 90 95 

Gly His Val Ala Ala Leu Ser Ser Val Asp Ala Asp Ser Ala Ser Pro 
100 105 110 

Phe Cys Tyr Ala Val Val Asn Arg Leu Thr Glu Asp Leu Leu Leu Ala 
115 120 125 

Ser Gly Val Pro Cys Ser Phe Ala Arg Ala Ser Leu Tyr lie Glu Phe 
130 135 140 

Phe Leu Gly Trp Leu Thr Gin Ala Arg Ser Thr Gly Leu Leu Arg Leu 
145 150 155 160 

Pro Ala Ala Asp Gly Arg Val Ser Leu Val Ala Arg Asp Asp Val Ala 
165 170 175 

Arg Ala Leu Ala Ala Leu Ala Val Gly Gly Pro Thr Gly Arg His His 
180 185 190 

Asp lie Thr Gly Pro Glu Ser Thr Asp Leu Ala Gly lie Ala Ser Thr 
195 200 205 

Ala Ala Glu Val Trp Arg Thr Pro Val Ala Tyr Val Asp He Pro Ala 
210 215 220 

Asp Thr Tyr Ser Ala Glu Thr Ala Ala Thr Gly Leu Asp Pro Trp Trp 
225 230 235 240 

Leu Tyr Ala Phe Ser Ser Leu Phe Ala Ser Val Arg Glu Gin Arg Trp 
245 250 255 

Asp Arg Val Arg Asp Asp Cys Ala Gin Leu Thr Gly Arg Leu Pro Arg 
260 265 270 



Thr Leu Arg Asp Val Leu Ser Glu Arg Ala 
275 280 
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<210> 118 
<211> 975 
<212> ADN 

<213> Streptomyces ambof aciens 

<220> 

<221> CDS 

<222> (1) . . (975) 

<400> 118 

atg etc cga cgc cgt etc gga ggg ccg tea ggc ccc etc gtc agt gee 48 

Met Leu Arg Arg Arg Leu Gly Gly Pro Ser Gly Pro Leu Val Ser Ala 
15 10 15 

ctg tgc ctg ggc gcg atg ccc ttc ggc acc acc gtc gac gag aag acg 9 6 
Leu Cys Leu Gly Ala Met Pro Phe Gly Thr Thr Val Asp Glu Lys Thr 
20 25 30 

tec ttc gee ate etc gac egg ttc gtc gag gee ggc ggc agt etc gtc 144 
Ser Phe Ala lie Leu Asp Arg Phe Val Glu Ala Gly Gly Ser Leu Val 
35 40 45 

gac acc gee gac aac tac gcg ttc tgg get ccc ggc ggg acc ggg gac 192 
Asp Thr Ala Asp Asn Tyr Ala Phe Trp Ala Pro Gly Gly Thr Gly Asp 
50 55 60 

gag age gag aac acc gtc ggg cgc tgg ctg gcg age cgc cgc cgc cgc 240 
Glu Ser Glu Asn Thr Val Gly Arg Trp Leu Ala Ser Arg Arg Arg Arg 
65 70 75 80 

gac gag gtg gtg ate tec acc .aag gtg ggt gec cgc ccc acc gtc ccc 2 88 
Asp Glu Val Val lie Ser Thr Lys Val Gly Ala Arg Pro Thr Val Pro 
85 90 95 

ggc age ggc ctg gag acc gee gaa ggg ctg teg get ccc gtc ata egg 33 6 
Gly Ser Gly Leu Glu Thr Ala Glu Gly Leu Ser Ala Pro Val lie Arg 
100 105 110 

aag gee gcg gag gac age ctg cga cgc ctg ggc acc gat cgc ate gat 3 84 
Lys Ala Ala Glu Asp Ser Leu Arg Arg Leu Gly Thr Asp Arg lie Asp 
115 120 125 

ctg tac tgg acc cac ate gag gac egg acc gtc cct ctg gag gag acg 432 
Leu Tyr Trp Thr His lie Glu Asp Arg Thr Val Pro Leu Glu Glu Thr 
130 135 140 

etc gga get etc gac gag ctg gtc ggc ggc ggc aag gtg gcg gtg ctg 480 
Leu Gly Ala Leu Asp Glu Leu Val Gly Gly Gly Lys Val Ala Val Leu 
145 150 155 160 

ggc tgc tec aac cac gcg ggc tgg cgc ate gaa egg gec cgc gcg etc 52 8 
Gly Cys Ser Asn His Ala Gly Trp Arg lie Glu Arg Ala Arg Ala Leu 
165 170 175 

gee egg acc aac ggc tgg acg gcg tac acc tgc gtc cag cag cgc tac 57 6 
Ala Arg Thr Asn Gly Trp Thr Ala Tyr Thr Cys Val Gin Gin Arg Tyr 
180 185 190 



tec tac ctt cag ccg cgc ttc gac gtc gga ctg ccg gag age gga cac 



624 
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m 



Ser Tyr Leu Gin Pro Arg Phe Asp Val Gly Leu Pro Glu Ser Gly His 
195 200 205 

gtc cac gcg acc tec gaa etc etc gac cac gta cgc age gag ccc gac 
Val His Ala Thr Ser Glu Leu Leu Asp His Val Arg Ser Glu Pro Asp 
210 215 220 



gee gtc gag ctg gag ctg ccc egg gag acg agg gca egg ctg gac etc 
Ala Val Glu Leu Glu Leu Pro Arg Glu Thr Arg Ala Arg Leu Asp Leu 
305 310 315 320 



672 



ctg acg ctg ctg gec tac teg tec ctg etc teg ggc gcg tac acc egg 720 
Leu T hr - Leu L .eu Ala. Tyr Ser Ser Leu Leu.. Ser . Gly -Ala -Tyr Thr Ara 
225 230 235 240 

ccg gac aag acc ctg tec gee gec tac gac cac ccg ggc acc ggg cag 768 
Pro Asp Lys Thr Leu Ser Ala Ala Tyr Asp His Pro Gly Thr Gly Gin 
245 250 255 

egg ctg acc gtg ctg egg gag gtg gec gec gag etc ggt gec acc gee 816 
Arg Leu Thr Val Leu Arg Glu Val Ala Ala Glu Leu Gly Ala Thr Ala 
260 265 270 

aac cag gtg gtg ctg tec tgg ttg etc gga ggt gat ccg ccg gtg ate 864 
Asn Gin Val Val Leu Ser Trp Leu Leu Gly Gly Asp Pro Pro Val He 
275 280 285 

ccg ate gtg ggg gtg agt tec gtc gag cag ctg gac gag gtg ctg gec 912 
Pro lie Val Gly Val Ser Ser Val Glu Gin Leu Asp Glu Val Leu Ala 
290 295 300 



960 



gec ggg egg ggc tga g7s 
Ala Gly Arg Gly 

325 



<210> 119 

<211> 324 

<212> PRT 

<213> Streptomyces ambofaciens 

<400> 119 

Met Leu Arg Arg Arg Leu Gly Gly Pro Ser Gly Pro Leu Val Ser Ala 
1 5 10 



15 



Leu Cys Leu Gly Ala Met Pro Phe Gly Thr Thr Val Asp Glu Lys Thr 
20 25 30 

Ser Phe Ala lie Leu Asp Arg Phe Val Glu Ala Gly Gly Ser Leu Val 
35 40 45 

Asp Thr Ala Asp Asn Tyr Ala Phe Trp Ala Pro Gly Gly Thr Gly Asp 
50 55 60 

Glu Ser Glu Asn Thr Val Gly Arg Trp Leu Ala Ser Arg Arg Arg Arg 
65 ™ 75 80 

Asp Glu Val Val He Ser Thr Lys Val Gly Ala Arg Pro Thr Val Pro 
85 90 95 

Gly Ser Gly Leu Glu Thr Ala Glu Gly Leu Ser Ala Pro Val He Arg 
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100 105 110 

Lys Ala Ala Glu Asp Ser Leu Arg Arg Leu Gly Thr Asp Arg lie Asp 
115 120 125 

Leu Tyr Trp Thr His lie Glu Asp Arg Thr Val Pro Leu Glu Glu Thr 
130 135 140 

Leu Gly Ala Leu Asp Glu Leu Val Gly Gly Gly Lys Val Ala Val Leu 
145 150 155 160 

Gly Cys Ser Asn His Ala Gly Trp Arg lie Glu Arg Ala Arg Ala Leu 
165 170 175 

Ala Arg Thr Asn Gly Trp Thr Ala Tyr Thr Cys Val Gin Gin Arg Tyr 
180 185 190 

Ser Tyr Leu Gin Pro Arg Phe Asp Val Gly Leu Pro Glu Ser Gly His 
195 200 205 

Val His Ala Thr Ser Glu Leu Leu Asp His Val Arg Ser Glu Pro Asp 
210 215 220 

Leu Thr Leu Leu Ala Tyr Ser Ser Leu Leu Ser Gly Ala Tyr Thr Arg 
225 230 235 240 

Pro Asp Lys Thr Leu Ser Ala Ala Tyr Asp His Pro Gly Thr Gly Gin 
245 250 255 

Arg Leu Thr Val Leu Arg Glu Val Ala Ala Glu Leu Gly Ala Thr Ala 
260 265 270 

Asn Gin Val Val Leu Ser Trp Leu Leu Gly Gly Asp Pro Pro Val lie 
275 280 285 

Pro lie Val Gly Val Ser Ser Val Glu Gin Leu Asp Glu Val Leu Ala 
290 295 300 

Ala Val Glu Leu Glu Leu Pro Arg Glu Thr Arg Ala Arg Leu Asp Leu 
305 310 315 320 

Ala Gly Arg Gly 



<210> 120 
<211> 1227 
<212> ADN 

<213> Streptomyces ambofaciens 

<220> 

<221> CDS 

<222> (!) . . (1227) 

<400> 120 

gtg acg ccc gag gcg gac gtc ggt acg egg tgg gag ccg gag ttc gac 

Val Thr Pro Glu Ala Asp Val Gly Thr Arg Trp Glu Pro Glu Phe Asp 

15 10 15 

atg ctg ccc ggc ata ccc gac ctg egg gec ttt ccc cgc gga egg tgg. 
Met Leu Pro Gly He Pro Asp Leu Arg Ala Phe Pro Arg Gly Arg Trp 



1er depot 
161 



20 25 30 

gcg gac gcg gtg egg gag gec acc ggc gca ctg acc tgg ggc gag etc 144 
Ala Asp Ala Val Arg Glu Ala Thr Gly Ala Leu Thr Trp Gly Glu Leu 
35 40 45 

ggc tac ccc gat ccg gec ggt etc gee egg etc egg cag egg etc geg 192 
Gly Tyr -Pro Asp Pro Ala Gly Leu Ala Arg Leu Arg Gin Arg Leu Ala 

- . - - 50 55 . . .... ... . 6-0 - - - 

gec tac etc gtg egg gga cgc ggc gcg teg ctg gaa gee egg -cag etc 240 
Ala Tyr Leu Val Arg Gly Arg Gly Ala Ser Leu Glu Ala Arg Gin Leu 
65 70 75 80 

gtc gtc tgc gcg ggc acg ctg gac gcg gtg cgc agg ctg tgc egg gtc 2 88 
Val Val Cys Ala Gly Thr Leu Asp Ala Val Arg Arg Leu Cys Arg Val 
85 90 95 

ctg egg acc gag ggc cac acc cac atg gee ctg gag gac cct ggc tgg 33 6 
Leu Arg Thr Glu Gly His Thr His Met Ala Leu Glu Asp Pro Gly Trp 
100 105 110 

teg egg ctg age gee acg gtc ggg gcg gag ggg ctg gtg ccc gtc ccg 3 84 
Ser Arg Leu Ser Ala Thr Val Gly Ala Glu Gly Leu Val Pro Val Pro 
115 120 125 

gtt ccc gtg gac ggc gac ggc ctg egg gtc gac ctg ctg egg cgc gcg 432 
Val Pro Val Asp Gly Asp Gly Leu Arg Val Asp Leu Leu Arg Arg Ala 
130 135 140 

cct cag gtc egg teg gtg ate gtc get ccc gee cac cag ttc ccg acc 480 
Pro Gin Val Arg Ser Val lie Val Ala Pro Ala His Gin Phe Pro Thr 
145 150 155 160 

ggt gtg gtc etc gee ccg gec cgt cgc ggc gag ctg gtc gee tgg gee 528 
Gly Val Val Leu Ala Pro Ala Arg Arg Gly Glu Leu Val Ala Trp Ala 
165 170 175 

cgc gag gtc gac ggc ctg gtg ctg gag gac gac tac gac gee gag ttc 57 6 
Arg Glu Val Asp Gly Leu Val Leu Glu Asp Asp Tyr Asp Ala Glu Phe 
180 185 190 

ega tac gac cgc cac ccc gtg ggc gee ctg cag ggc atg gca ccg gag 624 
Arg Tyr Asp Arg His Pro Val Gly Ala Leu Gin Gly Met Ala Pro Glu 
195 200 205 

cac gtc gcg ctg ctg ggg teg gtc age aag acg etc teg ccg gee ctg 672 
His Val Ala Leu Leu Gly Ser Val Ser Lys Thr Leu Ser Pro Ala Leu 
210 215 220 

egg ate ggc tgg gcg gtg acc ccg ccg cgc tgg acc gag gee ctg ggc 720 
Arg lie Gly Trp Ala Val Thr Pro Pro Arg Trp Thr Glu Ala Leu Gly 
22 5 230 235 240 

gcg gag cac gtc ggg ggc gta cca ccg ccc gtc ate gac cag gag gcg 768 
Ala Glu His Val Gly Gly Val Pro Pro Pro Val lie Asp Gin Glu Ala 
245 250 255 

ttc gee egg ttc ctg gee cgc ggg tec tac gac egg tac ctg egg gcg 816 
Phe Ala Arg Phe Leu Ala Arg Gly Ser Tyr Asp Arg Tyr Leu Arg Ala 
260 265 270 
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gca egg ctg cgc tac aaa egg cgc cgc gat cac etc atg gga gaa etc 864 
Ala Ar-g Leu Arg Tyr Lys Arg Arg Arg Asp His Leu Met Gly Glu Leu 
275 280 285 

gcg gcg teg ctg ccg ggg ttc cag gtg tec ggt gcg gcg gec ggc tte 912 
Ala Ala Ser Leu Pro Gly Phe Gin Val Ser Gly Ala Ala Ala Gly Phe 
290 295 300 

cac ctg ctg ctg tec ctg acg gac tgc teg gcg ccc acc gtc gtc agg 960 
His Leu Leu Leu Ser Leu Thr Asp Cys Ser Ala Pro Thr Val Val Arg 
305 310 315 320 

gag gcg gcg egg cgt gac gtg agg ctg gcg gat etc gac gee tac egg 1008 
Glu Ala Ala Arg Arg Asp Val Arg Leu Ala Asp Leu Asp Ala Tyr Arg 
325 330 335 

atg gcg egg gee gag cac cac ccg acg gee egg gee ggc gac tec ggc 10 5 6 
Met Ala Arg Ala Glu His His Pro Thr Ala Arg Ala Gly Asp Ser Gly 
340 345 350 

ggg gcg egg gec gtg gee gec gee ggc ccc gcg ctg gtc etc ggc tac 1104 
Gly Ala Arg Ala Val Ala Ala Ala Gly Pro Ala Leu Val Leu Gly Tyr 
355 360 365 

ggc aat ctg gcg gac cac gee gtg ccc gga gee gtg egg cgc ctg gca 1152 £ 
Gly Asn Leu Ala Asp His Ala Val Pro Gly Ala Val Arg Arg Leu Ala ;' 
370 375 380 

cag gec ate gac gcg gee egg cgc cac gac egg egg cac gtc gac gee 12 00. 
Gin Ala lie Asp Ala Ala Arg Arg His Asp Arg Arg His Val Asp Ala 
385 390 395 400 

ggg egg gee ggg gag egg gec gac tga 1227 
Gly Arg Ala Gly Glu Arg Ala Asp 

405 ; 3 - 

<210> 121 
<211> 408 
<212> PRT 

<213> Streptomyces ambofaciens 
<400> 121 

Val Thr Pro Glu Ala Asp Val Gly Thr Arg Trp Glu Pro Glu Phe Asp 
15 10 15 

Met Leu Pro Gly lie Pro Asp Leu Arg Ala Phe Pro Arg Gly Arg Trp 
20 25 30 

Ala Asp Ala Val Arg Glu Ala Thr Gly Ala Leu Thr Trp Gly Glu Leu 
35 .40 45 

Gly Tyr Pro Asp Pro Ala Gly Leu Ala Arg Leu Arg Gin Arg Leu Ala 
50 55 60 

Ala Tyr Leu Val Arg Gly Arg Gly Ala Ser Leu Glu Ala Arg Gin Leu 
65 70 75 80 



Val Val Cys Ala Gly Thr Leu Asp Ala Val Arg Arg Leu Cys Arg Val. 

85 90 95 
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Leu Arg Thr Glu Gly His Thr His Met Ala Leu Glu Asp Pro Gly Trp 
100 105 110 

Ser Arg Leu Ser Ala Thr Val Gly Ala Glu Gly Leu Val Pro Val Pro 
115 120 125 

Val Pro Val Asp Gly Asp Gly Leu Arg Val Asp Leu Leu Arg Arg Ala 

. . 130 . .. 135- 140 . 

Pro Gin Val Arg Ser Val He Val Ala Pro Ala His Gin Phe Pro Thr 
145 150 155 160 

Gly Val Val Leu Ala Pro Ala Arg Arg Gly Glu Leu Val Ala Trp Ala 
165 170 175 

Arg Glu Val Asp Gly Leu Val Leu Glu Asp Asp Tyr Asp Ala Glu Phe 
180 185 190 

Arg Tyr Asp Arg His Pro Val Gly Ala Leu Gin Gly Met Ala Pro Glu 
195 200 205 

His Val Ala Leu Leu Gly Ser Val Ser Lys Thr Leu Ser Pro Ala Leu 
210 215 220 

Arg He Gly Trp Ala Val Thr Pro Pro Arg Trp Thr Glu Ala Leu Gly 
225 230 235 240 

Ala Glu His Val Gly Gly Val Pro Pro Pro Val He Asp Gin Glu Ala 
245 250 255 

Phe Ala Arg Phe Leu Ala Arg Gly Ser Tyr Asp Arg Tyr Leu Arg Ala 
260 265 270 

Ala Arg Leu Arg Tyr Lys Arg Arg Arg Asp His Leu Met Gly Glu Leu 
275 280 285 

Ala Ala Ser Leu Pro Gly Phe Gin Val Ser Gly Ala Ala Ala Gly Phe 
290 295 300 

His Leu Leu Leu Ser Leu Thr Asp Cys Ser Ala Pro Thr Val Val Arg 
305 310 315 320 

Glu Ala Ala Arg Arg Asp Val Arg Leu Ala Asp Leu Asp Ala Tyr Arg 
325 330 335 

Met Ala Arg Ala Glu His His Pro Thr Ala Arg Ala Gly Asp Ser Gly 
340 345 350 

Gly Ala Arg Ala Val Ala Ala Ala Gly Pro Ala Leu Val Leu Gly Tyr 
355 360 365 

Gly Asn Leu Ala Asp His Ala Val Pro Gly Ala Val Arg Arg Leu Ala 
370 375 380 

Gin Ala He Asp Ala Ala Arg Arg His Asp Arg Arg His Val Asp Ala 
385 390 395 400 

Gly Arg Ala Gly Glu Arg Ala Asp 
405 
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<210> 122 
<211> 46 
<212> ADN 

<213> Sequence artif icielle 
<220> 

<223> Description de la sequence artif icielle : 
Oligonucleotide EDR3 9 

<400> 122 

cccaagcttg agaagggagc ggacattcat ggcccgcgcc gaacgc 



<210> 123 
<211> 46 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 
Oligonucleotide EDR42 

<400> 123 

cgggatccgg ctgaccatgg gagacgggcg catcgccgag ttcagc 



<210> 124 
<211> 46 
<212> ADN* 

<213> Sequence artificielle . 
<220> 

<223> Description de la sequence artificielle: 
Oligonucleotide EDR40 

<400> 124 

cccaagcttg agaagggagc ggacattcaa tgctttggta aagcac 

<210> 125 
<211> 38 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 
Oligonucleotide EDR41 

<400> 125 

cccaagcttt caaggaacga cggggtggtc agtcaagt 



<210> 126 
<211> 32 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 
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Oligonucleotide A 
<400> 126 

ccagtagata tcccgccaac ccggagctgc ac 



<210> 127 
<211> 32 

<212>. ADN - .. . . . _ _ 

<213> Sequence artificielle 

<220> 

<223> Description de la sequence artificielle 
Oligonucleotide B 

<400> 127 

gaaaagatcc gtcatggggt cgtgcgctcc tt 



<210> 128 
<211> 32 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle 
Oligonucleotide C 

<400> 128 

cacgacccca tgacggatct tttccgctgc at 



<210> 129 
<211> 32 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle 
Oligonucleotide D 

<400> 129 

gagccggata tcatcggtct tgccttgctc gt 



<210> 130 
<211> 25 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle 
Oligonucleotide ORF23c 

<400> 130 

acgtgcgcgg tgagttcgcc gttgc 



<210> 131 
<211> 25 
<212> ADN 



1 er depot 



166 



<213> Sequence artif icielle 
<220> 

<223> Description de la sequence artif icielle : 
Oligonucleotide ORF2 5c 

<400> 131 

ctgaacgacg ccatcgcggt ggtgc 



<210> 132 
<211> 25 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 
Oligonucleotide ORFl*c 

<400> 132 

gaccacctcg aaccgtccgg cgtca 25 



<210> 133 
<211> 23 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 
oligonucleotide 0RF2*c 

<400> 133 

ggcccggtcc agcgtgccga age 2 3 



<210> 134 
<211> 6174 
<212> ADN 

<213> Streptomyces ambof aciens 
<400> 134 

ctgcagaggg cgccgacgtg cgcggtgagt tcgccgttgc gccggctggt ccagccgagg 60 
ccgccgtgga ccgcgggcgc ctgtgcgcac agcaggcccc gggagecgag gtcgtgcagc 12 0 
aggecgaggg gcagctcgcc cgtccggtcc cactcggccg cccggtcgcc gaccagcgcg 180 
gtgaacagct cctcggcctc ggtgccgtcg gcgtgggagg tgtcagccac ctgcgtgccc 240 
ggtcgcctcg ccgggcgcgg ccagccgtcc gaccagccgg accatcgcgt cgacggtgcg 3 00 
gaagttgtcg agcatcaggt cggcgccgct gatgacgatg cegtaggtet tctccaggtg 360 
cacgacgagc tgcatggcga acagegagga catcccgccg aeggegaaca ggtcctggtc 420 
gcgctcccag gtggtcttgg tgcggtcctc gaggaacccg agcagttccc cggcgacctc 480 
gtcggcggtg ggggtcgtgc cggtggggtc gggccgaccg gacgtcgtgg teatcgegtg 54 0 
gcctcctggt agtcgtagaa tccccggccg ctcttgcggc cgagcaggcc ctggcggacc 600 
ttgtccagca gcagctcgct egggeggage gccggatcgc cggtccgttc gtgcatcacc 66 0 
cgcagcgagt eggecaggtt gtccagtccg ateaggtegg ccgtggccag gggtccggtg 72 0 
cggtggccga tgcagtcgcg catcagcgcg tccacggtct ccggggtggc ccggccctcg 7 80 
tgcaccaccg cgatggcgtc gttcagcatc eggtgeagea ggcggctggt cacgaagccg 840 
gcgccgtcgc cgacgacgat gccccggcgg cccaggccgg acagcaggtc ccgggtggcc 9 00 
cgggcggccg cctctccgct gcgcggtccg aggaccacct cgaccgtggg gatcaegtae 960 
gcggggttca tgaagtgcac gecgacgagg tcctcggggc gggggaegge gtcggccagc 1020 
tegtcgatgg ggacgcccga ggtgttgctg aegagcageg tccccgggcg cgccacggac 1080 
gccaggtccg ccagcacctc ggccttccgc teggggtect eggtgaegge ctcgatcacg 1140 
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gcggtcgcgg tggcgacggc ggccggcgcc tcctcgacgg tcagctcccc gggcgggcgg 1200 
tcgtggggca gcgcgcccat cagccgggcc gtccgcagat gcagcgcgac cgcgtcgggg 12 60 
gcggccgcgc gcgccccggc ggaggtgtcg accagtgtga ccgggtgccc gtgtccgacg 1320 
gcgagtgccg cgatggccgt gcccatgacg cccgcgccga gcacgacgag cggagaattt 1380 
tccttggaat cgggcacgga tcctccagaa tcccgggggc ggcggctgtg cgaaatgctg 1440 
tcccgaatcg cttccgcgct ccatcacccg ggcgtgactt Lgccacctag caagcggtgg 1500 
gaggccgggc ggaggctatg tcatctcggc cttgtccgct tacgagttcc gtccttaaag 1560 
tgcgcccggc gaacgcacgg cggaattgac tcgccgtccg tcaaggaccc gcggttcgaa 1620 
ggacctcgac. .gcatgaaggg tttcacatgg ctca-tafccgc attcttcatc cttccggttg 1680 
ccgggcatgt gaatccgacc ctgggagtcg ccgaggaact ggtcgcgcgc ggccaccggg 1740 
tgacgttcgc gctgtccgag gacctcgccg agcgggcccg- gctgatcggc gccgaggtgg 1800 
tcacctatcc ggtggacagg caacggttcc tggaccagat ggtgccgcgg caggacgcgg 1860 
acgagtacac ggacgaggac gagttcgtcc gggtcctgga gtggctgctg gacatgacgg 192 0 
tgcagaccat ggaaccgctg gagaggcact tcgccgggga ccggcccgac gtcgtcgtca 1980 
acgatccgtc gtcgctgtgg acgggacggc tgctggcgga ccggtggggc atcccggtca 2 040 
tccgcagcac tccgacctat gccgccaacg aacactggtc gctgcatccg ccggtcgact 210 0 
cggccgagcc gccggacgac cccgagctgc acaagctgct cgcgcggatc gagcggctgc 2160 
tggaggagca gggcgtcgag cacgacctgg ccggcttcac cggggtcctg cacggcggtc 2220 
cggccctgct gtacatgccc cgctcgttcc agtacgcggg cgagaccttc gacgcacagc 2280 
accacttcgt cggcccctgc ccgccccgca ccgcgttcca cggcgagtgg aggccggggg 2340 
acgacgacgg ccggcccctg gtgctggtga gtctcggaac cctgtacaac gaccggccgg 2400 
acttcttccg cacctgcctg gaggcgttcg gcgacgagcc ctggaacgtg cttctggtgc 2460 
tgggcggcgg ggtgcccgcg gccgacctgg gcccgcttcc cggcaatgtc cgggtgaccg. 2 52 0 
acttcgtgtc gctgcgcgac gtcctgccgc acacggcggt ggtggtgaac cacggtggga 2580 
tgagcaccgc catggaggtg ttctcgcacg gtgtgccggt ggtggcgatc ccggtgatgc 264 0 
cggagccccg ggccaccgcg cggcggatcg tcgaactggg cctgggcgac cagctgctga 2700 
actcggagct gacggccgag tccctgcgtg ccacggtacg gcgggtgctg gcggactccg 27 6 0 
cgatcccggg gaacatgcgc gggttccggg agcagatcag ggcggccggc ggggcgcccg 2 82 0 
cggcggccga cgcgatcgag ggactgctgc cccgggtggg ctgagacgtc cgcgcccgac 2 880 
acgcgttcac cttccgaacg gcgggatcgc cccatgctca tcaccgaaac agcagtgccc 2 940 
gacgtgttcc gcatcgatcc ggaaccgctg ccggaccacc ggggccggtt ctacgaagcg 3 000 
gtgcgccgcg ggccgctgga ggccgccgtc gggcactcgg tcgaggtccg gcaggtccac 3 060 
tgcaccgtct ccgggcgcaa cgtactgcgc ggcctgcacg ccaccaccct gccgccgggc 312 0 
caggccaaga tcctcacctg tgtgcggggt gcggcgctga ctatggtggt cgacatgagg 3180 
gtcgggtcac cgggcttcgg acggtacgag gcggtgcggc aggatgcccc gtcgggcacc 3240 
gcgctctacc tgccggacgg catcggcctg ggctacgtgg ccctcgcgga cgacacatgc 3300 
atgaactacc tgtgcaccga ggagtacgtc ccgggcatgg tcatcgacgt ggacgccctg 3360 
gaccccgaac tcggcctgcc gtggggactg accggggatc ccgtccgctc cgcccgggac 342 0 
gcggcggcgc cgtccctgcg ggcggccgcg gcggcgggaa ttctgcccac gtacgaggac 3480 
tgcttacggg tgcgcacgtc cgtgcccgcc cctcccgacc ggactcggct ctgacgcgac 3540 
ggacacgacc gccgcgcatc cgacgcgaat ccgacgcgaa tccgaactcg atttcccgaa 3 600 
ccgtggacgg agcgcgtccn nnnnnrmnnn nnnnnnnnnn nnnnnnrmnn nnnnnnnnnn 3 660 
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 372 0 
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 37 80 
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3 840 
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3 900 
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 39 6 0 
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 402 0 
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnc cgccacaccc 4080 
cccagcagcg tcagcgtccg cctcgggacc acacccggca ggacgacggg gtgcggggcg 4140 
acgaggctga gggagccccg caactccacg gggcggctca accgcttgag ctgctccatc 42 00 
aactgctggg ccgaggtggt ccccgtgtgg tggtccaccg ggccgcggcc gctcgccgag 4260 
gccagccgga ggttcccgcc cacccgcacc atgaagggca ggcccgcgag accgagccct 4320 
cgcaccagtc gtggcagcac ggccgcgcgt gcgtccatca ccacggggcg ggccaaggag 43 80 
cggttggcct gagcggcttc ggccaccagg cggacgatgt tctcctcctc accgggtgcg 4440 
ccggggtgcc ggggtgtgcc ctccccgctc cggccgccgc ccagcgtcag gcgccagctg 4500 
accggggcgg ccgtcgtgcc cgaggccagc cacagcccgt gactctgctg gcagctcacc 45 60 
acccggccca ggtcggagac gaagcgccgg ctcaccccga cggagcgcac ccccgccttg 4620 
gagaccacca tcggccagat cacccaggcg - tcgggggtca gcctgtcgtc cacgtagcgg 4680 
gccagcgcgg cccgcacctc gccccagtcc caggtcgacc cggcgacgaa gtggtgcagg 4740 
ctctgttccg ccgcgccctc tccgacgaag gcggcgaggt tccgggcggt cttgcgtccc 4800 
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tgtgccgtga gcagcccgcg tatgtactgc tcacctcttc tgcgctggtc cgcccggcgg 4860 
agcgaaccga gtaactccgc acatgcgtcg gagacgagcg agtcgaagtc gtgccgcgcg 492 0 
gcgggaccca cggggggcgc cgcgccggcg ggtcgaagcg tgcgtaaggt cataggagtc 49 80 
ctcgtggggg cctcgtcatc actgcgagtg gactgcgacc agcatcgcca attcacccgt 5040 
tgctccccag gtacaccggg cacactcgtt ccgcttcgct cccccggcgg cacggcccgc 5100 
gtgtggagca ctccccgctc tccggacggt gggggggaag cccaccgcac gcgcgccggt 5160 
agcggtgccg gggccccaca acccctcacc gacggggtcc gttcgaccac atgccgtgat 52 20 
gatgccttcg ccgcacggcc tccttgaatg acggaccgtc agaaagacgt cactccgcgc 52 80 
gcgcccgctc ccgccccgac cccgcccggc cgccgtcccg cccccgcgac cctgtgggcc 53 40 
gacgccctct tgacggaccc ggaatcccgg gccgcgggac gggacggcga ggaactcgat 5 4 00 
gccgcaaagg ttccgcgtcc tcaccggcac ctccgagatc cagcgcaacg gcatcgccaa 5460 
gctcctggct ttccaccact gagccgcacc ccctggcgag cagatccggg acaagacgcc 552 0 
accttcgcga cagtgtttag gaaaagttaa gtaaagaatt ccgcgagcgg attgccaggg 5580 
agaacaaccc attgacgcgc accggtgcag cggccacatt gacggcacct gtcaagttca 5 640 
cccccaggag cttggaatcc catgcaggca attcggcatc acgtcatgct cgtcatggcc 57 00 
ttcgtgaccg tcgccacgac tttccttctc tggccgtcga cgcaatccgc gcaagcgttt 57 60 
cccccgaccc cgaagcagac ggtactgaac cacctccgcg ccatttccgg gaatcacatc 582 0 
gtctccggac agcacaacaa ggagcccgcc tccgccccgg gccagtacac ccagcaggtc 5 880 
aaggacgtca ccgggcagta ccccggcctg tggggcggtg acctgatgtt cgccgcggcg 5940 
gacgtggccg gccgccagcg cgtcgtcgac caggccagga ccgagtgggc gaacggatcg 6000 
ctggtctcgc tcacctggca cgtctgcccg ccgaccggcg gcagcacctg tgcgttcgag 6060 
ggcggcgtca agtccacgct gacgaacgcg cagttctcgc aggtcctcac ggagggcagt 612 0 
gccctgaaca gcgcatggaa gcggcgcctg gacgaggtcg tcccgtacct gcag 617 4 



<210> 135 
<211> 4770 
<212> ADN 

<213> Streptomyces ambofaciens 
<400> 135* 

gaattccgcg agcggattgc cagggagaac aacccattga cgcgcaccgg tgcagcggcc 60 

acattgacgg cacctgtcaa gttcaccccc aggagcttgg aatcccatgc aggcaattcg 12 0 

gcatcacgtc atgctcgtca tggccttcgt gaccgtcgcc acgactttcc ttctctggcc 180 

gtcgacgcaa tccgcgcaag cgtttccccc gaccccgaag cagacggtac tgaaccacct 24 0 

ccgcgccatt tccgggaatc acatcgtctc cggacagcac aacaaggagc ccgcctccgc 3 00 

cccgggccag tacacccagc aggtcaagga cgtcaccggg cagtaccccg gcctgtgggg 360 

cggtgacctg atgttcgccg cggcggacgt ggccggccgc cagcgcgtcg tcgaccaggc 42 0 

caggaccgag tgggcgaacg gatcgctggt ctcgctcacc tggcacgtct gcccgccgac 480 

cggcggcagc acctgtgcgt tcgagggcgg cgtcaagtcc acgctgacga acgcgcagtt 540 

ctcgcaggtc ctcacggagg gcagtgccct gaacagcgca tggaagcggc gcctggacga 600 

ggtcgtcccg tacctgcagc agctggagaa cgcgggcgtc cccgtcctct tccggccgct 660 

gcacgagatg aacgaatcct ggaactggtg gggaaaccgg cccggagcga acggcagcgc 72 0 

acgcctctac cagatcaccc gcgatcacct cgccgggacg aaagggctgg acaatctgat 7 80 

ctgggtctgg aacgtccagg acaatccggc gggaaactgg aacagctact atccgggaga 840 

tcagtacgtg gacgtcgttt cgctggacgt ctggtacaag agccacccga gttccgccga 9 00 

ctaccagcag atgcggagca tcgcgggaac aaaacccatg gccctcgcgg agctgggcaa 960 

aatgccgacc gccgcgctgc tggacagcca gacgcggtgg acatggttca tgatgtggtc 102 0 

cgagcatctg cgcgggaaca attccaacgc cgaaatacag acggcgtatt tccacccccg 1080 

tgtactgaac cagggggagg tcgcactgcc ctgacgctcg gcgctgcccg gctctctcac 1140 

gcgcgttctg acaggacgtc gcggagagtg cggggcaagc ggccggtgag ctgggcgcag 1200 

tcgtcgcgga cccgatccca gcgctgttcg cgtaccgagg cgaacaggga ggagaaggcg 12 6 0 

tagagccacc agggatccag gccggtcgcc gctgtttcgg cagagtacgt gtcggccggg 132 0 

atgtccacgt aggcgaccgg tgtccgccac acctccgccg ccgtggaggc gatgcctgcc 13 80 

aggtccgtcg actcgggtcc cgtgatgtcg tggtgacggc cggtcggccc gcccaccgcg 1440 

agggcggcga gggcgcgggc cacgtcgtcg cgcgccacca gggacacccg gccatcggct 1500 

gccggcagcc tcagcagccc ggtcgagcgc gcctgggtga gccagcctag gaagaactcg 1560 

atgtacagcg aggccctggc gaacgagcac ggcacgccgg aggcgagcag cagatcctcg 162 0 

gtgagccggt tgacgacggc gtagcagaac ggggaggccg agtcggcgtc gacgctgctc 16 80 

agtgccgcga catggccgac gcgctcggcc accacggcgg cgacgacgtt gcggtggtgc 1740 

agcagcaccc gtgcgtcggg cccgtcgctg gagacgagga ccagagtgtc cacgcccttc 1800 
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agcgccgcac gcagagcggg cgggtcggcg tagtcggcga cggcgcactc cacccccggc 1860 
ggtagtgcct cggcaggcag cttccgcctg gtcatcgcca cgacgtccac gtcggcccgg 192 0 
tccgcgagca gctgcaccac ccgcctgccc agactgcccg ccgcccctgt caccgcgata 19 80 
cgcatcgtcg cccccgtcgc cttgtcgtcg gtcgtaccac cgtagggggc caaccgcgac 2 040 
cagggcttgg aacgagccgg cccgccaggg cacagacgcg cgatcggtcc ggttttcccg 2100 
tgctcttttg gaccgggacg ccggaccgct tcctttctac ggtggagccg ttcccycccy 2160 
agcccgcacg tcatcgacgt gcggggaaga cagaggtgat accgatgctc cgacgccgtc 2220 
tcggagggcc gtcaggcccc ctcgtcagtg ccctgtgcct gggcgcgatg cccttcggca 22 80 
ccaccg.tcga cgagaagacg tccttcgcca - tcctcgaccg gttcgtcgag gccggcggca 2340 
gtctcgtcga caccgccgac aactacgcgt tctgggctcc cggcgggacc ggggacgaga 2400 
gcgagaacac cgtcgggcgc tggctggcga gccgccgccg ccgcgacgag gtggtgatct 246 0 
ccaccaaggt gggtgcccgc cccaccgtcc ccggcagcgg cctggagacc gccgaagggc 2520 
tgtcggctcc cgtcatacgg aaggccgcgg aggacagcct gcgacgcctg ggcaccgatc 25 80 
gcatcgatct gtactggacc cacatcgagg accggaccgt ccctctggag gagacgctcg 2640 
gagctctcga cgagctggtc ggcggcggca aggtggcggt gctgggctgc tccaaccacg 2700 
cgggctggcg catcgaacgg gcccgcgcgc tcgcccggac caacggctgg acggcgtaca 2760 
cctgcgtcca gcagcgctac tcctaccttc agccgcgctt cgacgtcgga ctgccggaga 2820 
gcggacacgt ccacgcgacc tccgaactcc tcgaccacgt acgcagcgag cccgacctga 2 880 
cgctgctggc ctactcgtcc ctgctctcgg gcgcgtacac ccggccggac aagaccctgt 2940 
ccgccgccta cgaccacccg ggcaccgggc agcggctgac cgtgctgcgg gaggtggccg 3 000 
ccgagctcgg tgccaccgcc aaccaggtgg tgctgtcctg gttgctcgga ggtgatccgc 3060 
cggtgatccc gatcgtgggg gtgagttccg tcgagcagct ggacgaggtg ctggccgccg 312 0 
tcgagctgga gctgccccgg gagacgaggg cacggctgga cctcgccggg cggggctgac 3180 
gggccacaca ccgcccctcg cccgggacgg gctgaccggc cgcacaccgt ccctcagccg 3240 
ggacgggctg acggccacac acccgcccct cagcccggct gggctgggct gacggccaca 33 00 
cacccgctcc tcagcccggc tgggctgggc tgacggccac acacccgccc ctcagcccgg 33 60 
ctgggctggg ctgacggcca cacgccgtcc ctcgcccggg tcgggctgac cagccacacg 3420 
ccgtccctca gtcggcccgc tccccggccc gcccggcgtc gacgtgccgc cggtcgtggc 3480 
gccgggccgc gtcgatggcc tgtgccaggc gccgcacggc tccgggcacg gcgtggtccg 3540 
ccagattgcc gtagccgagg accagcgcgg ggccggcggc ggccacggcc cgcgccccgc 3 6 00 
cggagtcgcc ggcccgggcc gtcgggtggt gctcggcccg cgccatccgg taggcgtcga 3660 
gatccgccag cctcacgtca cgccgcgccg cctccctgac gacggtgggc gccgagcagt 3720 
ccgtcaggga cagcagcagg tggaagccgg ccgccgcacc ggacacctgg aaccccggca 3780 
gcgacgccgc gagttctccc atgaggtgat cgcggcgccg tttgtagcgc agccgtgccg 3840 
cccgcaggta ccggtcgtag gacccgcggg ccaggaaccg ggcgaacgcc tcctggtcga 3 900 
tgacgggcgg tggtacgccc ccgacgtgct ccgcgcccag ggcctcggtc cagcgcggcg 3960 
gggtcaccgc ccagccgatc cgcagggccg gcgagagcgt cttgctgacc gaccccagca 402 0 
gcgcgacgtg ctccggtgcc atgccctgca gggcgcccac ggggtggcgg tcgtatcgga 4080 
actcggcgtc gtagtcgtcc tccagcacca ggccgtcgac ctcgcgggcc caggcgacca 4140 
gctcgccgcg acgggccggg gcgaggacca caccggtcgg gaactggtgg gcgggagcga 42 00 
cgatcaccga ccggacctga ggcgcgcgcc gcagcaggtc gacccgcagg ccgtcgccgt 4260 
ccacgggaac cgggacgggc accagcccct ccgccccgac cgtggcgctc agccgcgacc 4320 
agccagggtc ctccagggcc atgtgggtgt ggccctcggt ccgcaggacc cggcacagcc 4380 
tgcgcaccgc gtccagcgtg cccgcgcaga cgacgagctg ccgggcttcc agcgacgcgc 4440 
cgcgtccccg cacgaggtag gccgcgagcc gctgccggag ccgggcgaga ccggccggat 450 0 
cggggtagcc gagctcgccc caggtcagtg cgccggtggc ctcccgcacc gcgtccgccc 4560 
accgtccgcg gggaaaggcc cgcaggtcgg gtatgccggg cagcatgtcg aactccggct 462 0 
cccaccgcgt accgacgtcc gcctcgggcg tcaccggagc ggggacggcc tgcgccctga 4680 
cccgggtggc cgagccgctg cgcgcctcca ggtacccctc cgcgacgagc tgcgcgtagg 4740 
ggggatcctc tagagtcgac ctgcaggcct 4770 



<210> 136 
<211> 28 
<212> ADN 

<213> Sequence artif icielle 
<220> 

<223> Description de la sequence artif icielle : 
Oligonucleotide EDR31 
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<400> 136 

cccaagcttc tgcgcccgcg ggcgtgaa 

<210> 137 
<211> 28 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle 
Oligonucleotide EDR37 

<400> 137 

gctctagaac cgtgtagccg cgccccgg 



<210> 138 
<211> 30 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle 
Oligonucleotide KF3 0 

<400> 138 

aagcttgtgt gcccggtgta cctggggagc 



<210> 139 
<211> 30 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle 
Oligonucleotide KF31 

<400> 139 

ggatcccgcg acggacacga ccgccgcgca 
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■ INSTHUT 
NATIONAL DE 
LA FROPRltTE 
1HOU3TRIFLLE 



DEPARTEMENT DES BREVETS 

26 bis, rue de Saint Petersbourg 
75S00 Paris Cedex 08 

Telephone : 33 (1) 53 04 53 04 Telecopie : 33 (1) 42 94 86 54 



BREVET D INVENTION 

CERTIFICAT D'UTILITE 

Code de la proprtete intellectuelle - Livre VI 

DESIGNATION D'INVENTEUR(S) Page N° j . . / 4 . 

(A fournir dans le cas ou les demandeurs et 

ies ifiventeurs ne soni pas ies rnernes person nes} 

Cet irnprime est a remplir llsiblement a I'encre noire 



N° 11235*03 



INV 



08 113 @ W / 270G01 



Vos references pour ce dossier (fa at I tat if) 


FRAV2002/0028A 


N° D'ENREGISTREMENT NATIONAL 


03 02439 



TITRE DE L r INVENTION (200 caracteres ou espaces maximum) 

POLYPEPTIDES IMPLIQUES DANS LA BIOSYNTHESE DES SPIRAMYCINES, SEQUENCES NUCLEOTIDIQUES 
CODANT CES POLYPEPTIDES ET LEURS APPLICATIONS. 



LE(S) DEMANDEUR(S) : 

AVENTIS PHARMA S.A. : 

20 avenue Raymond Aron - 92160 ANTONY (France) 

CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE (CNRS) : 
3 rue Michel Ange - 75794 PARIS CEDEX 16 (France) 



DESIGNE(NT) EN TANT QUMNVENTEUR(S) : 



Q Nom 


BLONDELET-ROUAULT 


Prenoms 


Marie-Heiene 


Adresse 


Rue 


26 avenue de I'Esterel 


Code postal et ville 


|9 i1 i4|0|0| ORSAY 


Societe d'appartenance (faadtatifj 




Q Nom 


DOMINGUEZ 


Prenoms 


Helene 


Adresse 


Rue 


74 rue Guillaume Puy 


Code postal et ville 


18 f 4 (0 i0 lQJ AVIGNON 


Societe d'appartenance (facultatif j 




Q Nom 


DARBON-RONGERE 


Prenoms 


Emmanuelle 


Adresse 


Rue 


6 rue du Grand Pare 


Code postal et ville 


|7 , 8 |9 i6 i0 | VOISINS LE BRETONNEUX 


Societe d'appartenance (facultatif) 





S'il y a plus de trois inventeurs, utilisez plusieurs formulaires. Indiquez en haut a drorte le N° de la page suivi du nombre de pages. 



DATE ET SIGNATURE(S) 
DU (DES) DEMANDEUR(S) 
OU DU MANDATAIRE 
(Nom et qua lite du signataire) 



BOUVET Philippe \KkkU\ 

La loi n°78-17 du 6 janvier 1978 relative a I'informatique, aux fichiers et aux liberies s r applique aux reponses faites a ce formulaire. 
Elle garantit un droit d'acces et de rectification pour les donnees vous concernant aupres de I1NPI. 
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•INSTHUT 
NATION*! Dt 
LA PROPRIETC 
INOU3TRICILE 



DEPARTMENT DES BREVETS 

26 bis, rue tie Saint Petersbourg 
75800 Paris Cedex 08 

Telephone : 33 (1) 53 04 53 04 Telecopie : 33 (1) 42 94 86 54 



BREVET D'INVENTION 

CERTIFICAT D'UTILITE 

Code de la propriete inteflectuelfe - Livre VI 

DESIGNATION D'INVENTEUR(S) Page N° ?. . /< 

(A fournir dans le cas od les demandeurs et 

les inventeurs ne sont pas les memes personnes) 

Get imprime est a remplir lisiblement a i'encre noire 



N° 11235"03 



INV 



D3 1 13© W/ 270601 



Vos references pour ce dossier (faculfatif) 


FRAV2002/0028A 


N° D'ENREGISTREMENT NATIONAL 


03 02439 



TITRE DE ^INVENTION (200 caracteres ou espaces maximum) 

POLYPEPTIDES IMPLIQUES DANS LA BIOSYNTHESE DES SPIRAMYCINS, SEQUENCES NUCLEOTIDIQUES 
CODANT CES POLYPEPTIDES ET LEURS APPLICATIONS. 



LE(S) DEMANDEUR(S) : 

AVENTIS PHARMA S.A. : 

20 avenue Raymond Aron - 92160 ANTONY (France) 

CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE (CNRS) : 
3 rue Michel Ange - 75794 PARIS CEDEX 16 (France) 



DESIGNE(NT) EN TANT QU'INVENTEUR(S) 



Q Nom 


GERBAUD ! 


Prenoms 


Claude 


j Adresse 


Rue 


3 allee Dunand 


Code postal et ville 


!9i3i2i2i0| GAG NY 


Societe d'appartenance t faculfatif j 




Q Nom 


GONDRAN " ' 


Prenoms 


Anne 


j Adresse 


Rue 


27 rue de Tlnterne Loeb 


Code postal et ville 


|7 i5i0 i1 1 3 I PARIS 


j Societe d'appartenance ('faculfatif j 




O Nom 


KARRAY 


Prenoms 


Fatma 


Adresse 


Rue 


Residence Universitaire les Rives de I'Yvette 
Batiment 233, ch 2008 


Code postal et ville 


!9 1 1 i4 |4 ,0 I BURES SUR YVETTE ! 


Societe d'appartenance (facuUatifj 





S f il y a plus de trois inventeurs, utilisez plusieurs formulaires. Indiquez en haut a droite le N° de la page suivi du nombre de pages. 



DATE ET SIGNATURE(S) 
DU (DES) DEMANDEUR(S) 
OU DU MANDATAIRE 
(Nom et qualite du signataire) 



BOUVET Philippe 




La loi n°78-17 du 6 janvier 1978 relative a I'informatique, aux fichiers et aux liberies s'applique aux reponses faites a ce forrnulaire. 
Elle garantit un droit d'acces et de rectification pour les donnees vous concernant aupres de I'lNPI. 



regue I e 07/03/03 



■ INSTITUT 
NATIONAL DE 
LA PROfHIttt 

iHoujrmtiLf 



DEPARTEMENT DES BREVETS 

26 bis, rue tie Saint Petersbourg 



BREVET DINVENTION 

CERTIFICAT D'UTILITE 

\ Code de la propriety intellectuelie - Livre VI 

DESIGNATION D'INVENTEUR(S) Page N° ? 

(A fournir dans le cas ou les demandeurs et 

ies inventeurs ne sont pas les memes personnes) 



N° 11235*03 



IN 



Vos references pour ce dossier (jhadtatif) 


^ci uiiLjf fjiic cbi d rempur H&tDiemem a i encre noire db 113 @w/ 270601 
FRAV2002/0028A _ _ 


N° D'ENREGISTREMENT NATIONAL 

TIT DC nc 1 MKIlfEMTIAM 


03 02439 



POLYPEPTIDES IMPUGUES DANS LA BIOSYNTHESE DES SPIRAMYCINES, SEQUENCES NUCLEOTIDIQUES 
CODANT CES POLYPEPTIDES ET LEURS APPLICATIONS. 



LE(S) DEMANDEUR(S) : 

AVENTIS PHARMA S.A. : 

20 avenue Raymond Aron - 92160 ANTONY (France) 

CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE (CNRS) : 
3 rue Michel Ange - 75794 PARIS CEDEX 16 (France) 



DESIGNE(NT) EN TANT QU'INVENTEUR(S) : 



Q Norn 


LACROIX 


Prenoms 


Patricia 


Adresse 


Rue 


28 allee de Bellevue 




Code postal et vrlle 


|9|4,1 i7i0| LE PERREUX 


Societe d'appartenance (jhcultatif) 




Q Norn 


OESTREICHER-MERMET-BOUVIER 


Prenoms 




Nathalie 


Adresse 


Rue 


9 rue Louise Filliaux-Tiger 




Code postal et ville 


i9|2|1 ,4|0I CLAMART 


Societe d'appartenance { facuhatij) 




Q Nom 


PERNODET 


Prenoms 




Jean-Luc 


I Adresse 


Rue 


21 rue des Jardins 




Code postal et ville 


!9 ,4,2,3i0|CACHAN 


Soc iete d' a p pa rte na nc e (faatltatij) 





Sil y a plus de trois inventeurs, utiiisez pfusieurs formulaires. Indiquez en haut a droite le N° de la page suivi du nombre de 



DATE ET SIGNATURE(S) 
DU (DES) DEMANDEUR(S) 
OU DU MANDATAIRE 
(Nom et qualite du signataire) 



BOUVET Philippe 

La loi n°78-17 du 6 janvier 1978 relative a rinformatique, aux fichiers et aux liberies s'applique aux reponses faites a ce formulaire. 
Elle garantit un droit d'acces et de rectification pour les donnees vous concernant aupres de I'lNPI. 




recue le 07/03/03 



■ IMSTHUT 
HATIONAL DC 
IA PROPRIEIE 
IHOUSTRCELLE 



DEPARTEMENT DES BREVETS 

26 bis, rue de Saint Petersbourg 
75800 Paris Cedex 08 

Telephone : 33 (1) 53 04 53 04 Tetecopie : 33 (1) 42 94 86 54 



BREVET D'INVENTION 
CERTIFICAT D UTILITE 

^ Code de ia propriete intellectuelle - Livre VI 

DESIGNATION DMNVENTEUR(S) Page N° 4. . /4. 

(A fournir dans le cas ou les demandeurs et 

les inventeurs ne sont pas les memes personnes) 



N° 11235*03 



INV 



Cet imprime est a remplir lisiblement a f'encre noire 



DB 113 @W / 270601 



Vos references pour ce dossier (fa cu Hat if) 


FRAV2002/0028A 


N° D'ENREGISTREMENT NATIONAL 


03 02439 



TITRE DE L'iNVENTION (200 caracteres ou espaces maximum} 

POLYPEPTIDES 1MPLIQUES DANS LA BIOSYNTHESE DES SPIRAMYCINES, SEQUENCES NUCLEOTIDIQUES 
CODANT CES POLYPEPTIDES ET LEURS APPLICATIONS. 



LE(S) DEMANDEUR(S) : 

AVENTIS PHARMA S.A. : 

20 avenue Raymond Aron - 92160 ANTONY (France) 

CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE (CNRS) : 
3 rue Michel Ange - 75794 PARIS CEDEX 16 (France) 



DESIGNE(NT) EN TANT QU'INVENTEUR(S) : 



D Nom 


TUPHILE 


Prenorns 


Karine 


Adresse 


Rue 


18A rue de I'Oratoire 


Code postal et ville 


|6 1 9 1 3 ,0 i0 i CALUIRE ETCUIRE 


Societe d'appartenance ijhcuhalif) 




Eg Nom 




Prenorns 




Adresse 


Rue 




Code postal et ville 


I i I ! I I 


Societe d'appartenance (faatttatij) 




E2 Nom 




Prenorns 




Adresse 


Rue 




Code postal et ville 


I I I ! I ! 


Societe d'appartenance (facultatifj 





S'il y a plus de trois inventeurs, irtilisez plusieurs formulaires. Indiquez en haut a droite le N° de la page suivi du nombre de pages. 



DATE ET SIGNATURE(S) 
DU (DES) DEMANDEUR(S) 
OU DU MANDATAIRE 




La loi n°78-17 du 6 janvier 1978 relative a Tinformatique, aux fichiers et aux liberies s'applique aux reponses faites a ce formulaire. 
Elle garantit un droit d'acces et de rectification pour les donnees vous concernant aupres de PINPI. 
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